Ведущий инженер систем мониторинга (удаленная работа)

12 мая 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Ведущий инженер систем мониторинга

Описание вакансии

А также находимся в поиске ведущего инженера систем мониторинга в нашу расширяющуюся команду департамента инфраструктуры.

Чем нужно будет заниматься?

  • Развитие подходов к мониторингу, создание и развитие внутренних инструментов (боты автоматизации кастомные системы сбора метрик), кодовая база преимущественно на Python.
  • Подготовка мониторинга и алертинга по запросам от смежных команд;
  • Подготовка описания по метрикам и дашбордов для команд разработки, тестирования, технической поддержки.
  • Написание поддержка актуальной документации по инструментам и решениям отдела мониторинга
  • Оказание менторской поддержки 1-2 дежурному инженеру (после ИС)

Что мы ждем от будущего коллеги:

  • Опыт работы с системами мониторинга от 3-х лет;
  • Понимание принципов построения систем мониторинга As-a-S;
  • Знание особенностей архитектуры и взаимодействия компонентов мониторинга на базе TSDB Prometheus (thanos victoria metrics), конфигурирования, написания кастомных экспортеров;
  • Опыт работы с системами сбора, анализа и визуализации логов. Стеки могут быть разными, важно общее понимание интеграций и способность применить к большому спектру задач: Elasticsearch, Logstash, Fluentd, Rsyslog, Graylog, InfluxDB, Grafana, Kibana, EQL KQL запросы;
  • Знание и умение использования профильных команд для администрирования и конфигурирования ОС и прикладных приложений, умение использовать базовые команды утилиты, написание sh скриптов;
  • Умение работать с системами управления кодом (git), базовое понимание устройства ci cd;
  • Python - понимание принципов ООП, чтение кода, понимание устройства структуры и используемых технологий, функциональное программирование;
  • Понимание микросервисной инфраструктуры, устройства и кластеризации.

Стэк технологий

  • Grafana + OnCall(wip)
  • Prometheus (HA, thanos operator)
  • AlertManager + Karma
  • BlackBox + UptimeKuma
  • Jaeger
  • ELK stack (opendistro)
  • Jira Confluence
  • AirFlow
  • N8N