Вакансия: Руководитель группы мониторинга (Lead SRE)
Описание вакансии
Группа мониторинга - "глаза" всей службы ИТ, команда отвечает за настройку и отслеживание алертов, инцидент-менеджмент. В 2025 году мы поставили цель внедрить в работу команды SRE-практики, снизить время реагирования на инциденты и улучшить MTTR
За что предстоит отвечать:
- управление командой 7 человек: 1-1, мотивация, развитие
- автоматизация и шаблонизация работы с инцидентами, внедрение практики ранбуков в работе дежурных
- обработка запросов от заказчиков, оперативное выявление и устранение проблем
- взаимодействие с другими командами: разработчиками, DevOps, инфраструктурой и др. для обеспечения бесперебойной работы продуктов
- ведение и актуализация технической документации
Для нас важно:
- опыт управления командой SRE или командой мониторинга
- опыт работы на On-Premise инфраструктуре (VmWare, RHEL, Vanilla K8S)
- опыт работ с системами мониторинга (VictoriaMetrics, Grafana, AlertManager)
- глубокие знания ОС Linux (процессы, файловая система, сети, инструменты отладки)
- опыт работы с системами централизованного логирования (ELK-стек)
- понимание принципов работы и настройки высоконагруженных и отказоустойчивых систем
Как мы работаем:
- 24/7 создаем продукты и сервисы, которые делают удобнее жизнь 23 млн клиентов в 40 странах мира
- даем самостоятельность в принятии решений и возможность влиять на бизнес
- заботимся о твоем благополучии: ДМС со стоматологией после 3 месяцев работы, доступ к платформе Ясно, корпоративные скидки в Bestbenefits
- постоянно обмениваемся опытом и делимся экспертизой во внутренних гильдиях, обучаем спикерству, помогаем в подготовке статей и выступлений
- создали прозрачную систему грейдов с возможностью регулярной оценки, и менторами для прокачки скиллов