DevOps/SRE Engineer / Системный администратор Linux (удаленная работа)

27 апреля 2024

Уровень зарплаты:
от 250 000 до 350 000 руб.
Требуемый опыт работы:
Не указан

Вакансия: DevOps/SRE Engineer / Системный администратор Linux

Эвотор — лидер технологической трансформации малого и среднего бизнеса в России. Мы создали онлайн-кассу, которую использует каждый четвертый предприниматель страны. В маркетплейсе Эвотора уже более 850 сервисов для автоматизации бизнеса.
В основе нашего решения лежат требования к постоянным высоким нагрузками и непрерывности работы.


Вам предстоит:


  • Обеспечивать бесперебойную работу серверов и сервисов в разных средах (Production, Development)

  • Разрабатывать конвейеры для CI/CD и поддерживать системы CI/CD

  • Заниматься автоматизацией разворачивания и сопровождения ПО

  • Взаимодействовать с командами проекта

  • Настраивать и поддерживать системы мониторинга и сбора логов

  • Заниматься настройкой резервного копирования и восстановлением после сбоев

Кого ищем:


  • Опыт работы от 3+ лет в области администрирования ОС Linux

  • Опыт работы с Kubernetes (установка, настройка, создание манифестов) и сборки Docker-images

  • Опыт деплоя с помощью с Helm

  • Опыт использования системы управления конфигурациями на практике (желательно Ansible или Terraform)

  • Опыт настройки конвейеров в системах CI/СD (у нас Jenkins и Gitlab)

  • Опыт администрирования и настройки СУБД PostgreSQL на уровне установки кластера, организации репликации, создания бэкапов и восстановления из бэкапов (у нас кластеры под управлением Patroni)

  • Интерес к изучению новых технологий и их внедрению

  • Наличие базовых знаний стека протоколов TCP/IP

Будет плюсом:


  • Опыт работы с Kafka

  • Опыт работы с системами сбора и анализа логов на базе Elasticsearch

  • Опыт работы с системой мониторинга Prometheus

  • Опыт настройки и эксплуатации СУБД Cassandra (на уровне установки кластера, удаления или добавления серверов в кластер)

Об инфраструктурной команде проекта:


  • Кластеры Kubernetes у нас в промышленной эксплуатации находятся несколько лет. Есть возможность с нуля "затащить" Service Mesh (например, Istio)

  • В наличии множество кластеров СУБД PostgreSQL, нагруженных и не очень. За всем нужно будет следить (например, вовремя добавлять место на дисках)

  • Приложения, развернутые в Kubernetes, генерируют интенсивный поток логов - собираем их с помощью Fluentd в Elasticsearch, смотрим с помощью Kibana. Кластеры Elasticsearch нужно будет поддерживать и вовремя расширять

  • Также для сбора и анализа логов Nginx используем Clickhouse и Grafana

  • Используем Prometheus в первую очередь для мониторинга кластеров Kubernetes и разработанных приложений, а также, по возможности, всего остального

  • Разрабатываемые приложения активно используют Kafka, поэтому понадобится развиваться и в области администрирования кластеров Kafka.

  • Автоматизацию развертывания различного ПО осуществляем в основном с помощью Ansible, создания виртуальных машин - с помощью Terraform

  • У нас также имеются несколько кластеров СУБД Cassandra, поэтому у нас можно, например, получить опыт добавления новых нод в Production-кластер

Что предлагаем:


  • Удаленная работа или современный офис м. Парк Культуры

  • Гибкий график с разумным количеством рабочих встреч

  • Мощный ноутбук 

  • Оплачиваемое обучение от компании

  • Расширенный пакет ДМС по России



Посмотрите похожие вакансии

SRE Engineer (Site Reliability)
Компания: Gurtam
Зарплата: з.п. не указана