Мы - международная компания в сфере сетевой безопасности, работаем на глобальном рынке с 2017 года, имеем более 40 млн активных пользователей ежемесячно
Инфраструктура включает:
контейнеры (Kubernetes, Docker)
микросервисный backend
Развёртывание в Hetzner, AWS и Cloudflare с полной автоматизацией через GitOps
Надёжность и наблюдаемость ключевые принципы нашей работы
Ищем Senior Monitoring Engineer, который будет отвечать за весь стек наблюдаемости и развивать AI-assisted monitoring
Обязанности:
Разработка, внедрение и развитие системы мониторинга и observability для распределённой инфраструктуры (VPN, контейнеры, облака)
Настройка и поддержка мониторинга Kubernetes/Docker, веб-сервисов и backend-инфраструктуры
Построение и оптимизация системы алертинга (без alert fatigue), создание SLO/SLI и контроль error budget
Организация и развитие централизованного логирования (Fluent Bit, Kafka, Vector, Loki/Elasticsearch), анализ и корреляция логов
Внедрение автоматизированных проверок доступности (blackbox monitoring) из разных регионов
Анализ инцидентов, участие в RCA, разработка runbooks и повышение надёжности систем
Развитие интеллектуального мониторинга (AIOps): детекция аномалий, прогнозирование, автоматизация реагирования