Вакансия: Ведущий инженер систем мониторинга
Описание вакансии
А также находимся в поиске ведущего инженера систем мониторинга в нашу расширяющуюся команду департамента инфраструктуры.
Чем нужно будет заниматься?
- Развитие подходов к мониторингу, создание и развитие внутренних инструментов (боты автоматизации кастомные системы сбора метрик), кодовая база преимущественно на Python.
- Подготовка мониторинга и алертинга по запросам от смежных команд;
- Подготовка описания по метрикам и дашбордов для команд разработки, тестирования, технической поддержки.
- Написание поддержка актуальной документации по инструментам и решениям отдела мониторинга
- Оказание менторской поддержки 1-2 дежурному инженеру (после ИС)
Что мы ждем от будущего коллеги:
- Опыт работы с системами мониторинга от 3-х лет;
- Понимание принципов построения систем мониторинга As-a-S;
- Знание особенностей архитектуры и взаимодействия компонентов мониторинга на базе TSDB Prometheus (thanos victoria metrics), конфигурирования, написания кастомных экспортеров;
- Опыт работы с системами сбора, анализа и визуализации логов. Стеки могут быть разными, важно общее понимание интеграций и способность применить к большому спектру задач: Elasticsearch, Logstash, Fluentd, Rsyslog, Graylog, InfluxDB, Grafana, Kibana, EQL KQL запросы;
- Знание и умение использования профильных команд для администрирования и конфигурирования ОС и прикладных приложений, умение использовать базовые команды утилиты, написание sh скриптов;
- Умение работать с системами управления кодом (git), базовое понимание устройства ci cd;
- Python - понимание принципов ООП, чтение кода, понимание устройства структуры и используемых технологий, функциональное программирование;
- Понимание микросервисной инфраструктуры, устройства и кластеризации.
Стэк технологий
- Grafana + OnCall(wip)
- Prometheus (HA, thanos operator)
- AlertManager + Karma
- BlackBox + UptimeKuma
- Jaeger
- ELK stack (opendistro)
- Jira Confluence
- AirFlow
- N8N