4 февраля 2026
Проектировать и внедрять новые способы наблюдения за инфраструктурой от метрик до прогнозов;
Настройка и оптимизация триггеров, шаблонов, LLD, интеграций с другими системами;
Анализ инцидентов и событий мониторинга чтобы убрать шум, поймать скрытые проблемы и автоматизировать рутину;
Консультировать коллег и заказчиков по вопросам мониторинга и метрик;
Вести понятную и актуальную документацию;
Обеспечивать резервное копирование, обновления и безопасность систем мониторинга;
Участвовать в улучшении процессов меньше рутины, больше надёжности.
Реальный опыт с Zabbix в production от 2 лет (желательно 6.0+);
Опыт системного администратора от 6 лет;
Уверенное владение архитектурой Zabbix, триггерами, скриптами (Python/Bash/PowerShell);
Понимание сетей, виртуализации, СУБД (PostgreSQL/MySQL), резервного копирования;
Аналитический склад ума и стремление к культуре наблюдаемости ;
Умение работать в команде и объяснять сложное простыми словами;
Английский для чтения документации.
Будет плюсом:
- Опыт с Prometheus/Grafana/ELK;
- Интеграции через API, автоматизация;
- Работа с отечественными ОС;
- Практики SRE, управление SLO, участие в инцидент-менеджменте;
- Профильные сертификаты.