Ведущий специалист систем мониторинга (SRE) (удаленная работа)

13 сентября 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Ведущий специалист систем мониторинга (SRE)

Описание вакансии

О компании

Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году.

Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а произ водител ям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду.

О мониторинге:

Сама система мониторинга в настоящее время строится на стеке: Kubernetes, Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 18 0 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагру жен ных ин форма ционных систем.

Чем предстоит заниматься:

Построение, внедрение и развитие высоконагру жен ных многокомпонентных систем мониторинга:

  • Постановка на мониторинг инфраструктуры, прило жен ий и бизнес показателей. Для всех стендов, включая разработку и тестирование;

  • Развитие централизованной системы мониторинга;

  • Создание и маршрутизация оповещений, включая предиктивную аналитику;

  • Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы);

  • Интеграция систем мониторинга с другими системами компании;
  • Авто матизация процессов мониторинга;
  • Создание и построение комплексных экранов систем мониторинга;
  • Внедрение CI/CD для компонентов мониторинга;
  • Разработка системы логирования для прило жен ий;
  • Обеспечение отказоустойчивости и быстродействия создаваемой системы;
  • Разработка прило жен ий для нужд мониторинга в случаях, когда готового решения не существует.

От успешного кандидата мы ожидаем:

  • Опыт работы с Kubernetes (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом);
  • Опыт администрирования ОС семей ства Linux (Debian-based);
  • Знания устройства и принципов работы docker;
  • Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN;
  • Опыт внедрения и построения многокомпонентных систем мониторинга (Prometheus-like стек, VictoriaMetrics, Graylog, Zabbix);
  • Опыт поддержки высоконагру жен ных систем мониторинга;
  • Опыт настройки и администрирования Grafana, ELK, Prometheus;
  • Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом;
  • Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java);
  • Опыт работы с системами виртуализации и Linux-контейнерами;
  • Опыт в работе с Helm(написание простых чартов, понимание принципов работы helm-template);
  • Уверенный пользователь систем версионирования кода (Предпочтительно Git);
  • Опыт работы с Gitlab CI;
  • Умение работать с системами управления авто матического развертывания кон фигур аций (Предпочтительно Ansible).

Что вам точно понравится:

  • Сложные и интересные задачи, работа с современным востребованным стеком;

  • Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи;

  • Кон куре нтная ЗП, оформление по ТК РФ ;

  • ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками;

  • Страхование жизни и здоров ья;

  • Предоставляем всю необходимую технику для работы;

  • Возможность работать удаленн о/частично удаленн о;

  • Кафетерий льгот (возмещение расходов на любое самообразование, спорт , ДМС для членов семьи, доступ к ИТ сервисам и т.д).



Посмотрите похожие вакансии

MLOps инженер/ML Platform Engineer
Компания: РУСАЛ, Центр подбора персонала
Зарплата: з.п. не указана
DevOps / SRE инженер
Компания: Аптеки Плюс
Зарплата: з.п. не указана
Technical Support Specialist
Компания: Софтвайс
Зарплата: от 60 000 до 60 000 руб.
ML инженер в IT-продукты
Компания: Т-Банк
Зарплата: з.п. не указана