реакция на алерты в мониторинге (в мессенджер пришло сообщение с инструкцией, необходимо выполнить её; в инструкции "перевыкатить сервис" или "позвонить инженеру");
принятия нового микросервиса на мониторинг (команда разработки, отправляет команде мониторинга реквест, предоставляя то что хотела бы мониторить);
проверка обновленных конфигураций мониторинга (команд разработки много, править и акутализировать мониторинг может кто угодно; дежурный является "аппрувером" изменений);
быстрая фиксация и оповещение о крупных инцидентах;
развитие существующих инструментов мониторинга.
Требования:
знаете Linux, умеете траблшутить проблемы с ОС и железом;
имеете опыт с системами мониторинга уровня Zabbix, Prometheus, ELK, Grafana и другими;
имеете опыт с git и базовое понимание работы системы контроля версий.
Будет здорово, если вы:
имеете опыт работы в сменном графике с ночными дежурствами.
Работа у нас это:
возможность реализовать свои идеи в проекте с многомиллионной аудиторией;