Сопровождение инцидентов на инфраструктуре, анализ причин сбоя;
Написание скриптов, программ, pipeline, playbook упрощающих диагностику проблем;
Развитие, администрирование и эксплуатация системы мониторинга на платформе Zabbix;
Постановка оборудования на мониторинг, разработка новых шаблонов и поддержание в актуальном виде метрик, заведение, проработка, анализ новых полезных метрик.