15 января 2025
Продуктовая IT компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой B2B решения развлекательной, игровой и спортивной тематики, находится в поисках Site Reliability Engineer (SRE).
Чем предстоит заниматься:
Улучшать систему и процессы мониторинга, повышать Observability системы;
Проектировать, внедрять и поддерживать метрики для мониторинга;
Улучшать процессы инцидент-менеджмента;
Участвовать в устранении сбоев и расследовании их причин;
Поддерживать бесперебойную работу сервисов;
Договариваться с коллегами и находить лучшие решения для проекта.
Какие навыки нужны:
Умеешь в Linux на уровне системного администратора;
Уверенно владеете одним из языков программирования: Go, C#, Python, Java и другие;
Понимание принципов работы сетей и протоколов взаимодействия; приложений, навыки диагностики проблем с ними;
Работали с системами контроля версий Git;
Работали с системами мониторинга и алертинга Prometheus и Grafana, агрегаторами логов;
Работали с системами контейнеризации и оркестрации Docker и k8s;
Высокий уровень самостоятельности.
Что компания может предложить: