SRE (Инженер по доступности микросервисной платформы) (удаленная работа)

17 декабря 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: SRE (Инженер по доступности микросервисной платформы)

Описание вакансии

Комус ведущий производитель и комплексный поставщик товаров и услуг для бизнеса.

IT-ландшафт включает в себя собственные ЦОДы, мощности в облаках и 100 бизнес-приложений, 40 из которых крупные.

Сегодня ИТ-подразделение Комус это аккредитованная ИТ-компания, численностью свыше 900 сотрудников.

Мы реализуем амбициозную программу цифровой трансформации, и в нашей команде открыта вакансия инженера по доступности и эксплуатации микросервисной платформы

ПРЕДЛАГАЕМ

  • Конкурентный доход (обсуждаем индивидуально)
  • Официальное оформление по ТК РФ в аккредитованную ИТ-компанию
  • Гибридный или удаленный формат работы (гибкость и индивидуальный подход), график 5/2 с 9.00 до 18.00
  • Удобную локацию новый современный офис БЦ Интеграл в пешей доступности от ст. м. Авиамоторная
  • Развитую офисную инфраструктуру: кофе-поинты с бесплатными напитками и снеками, корпоративный бесплатный фитнес-центр и игровые пространства
  • ДМС
  • Корпоративную программу лояльности и скидок (товары и услуги, развлечения, рестораны, спорт, отдых и многое другое)
  • Абонементы в фитнес-клубы по специальным условиям
  • Дополнительное премирование в рамках реферальной программы Все в Комус
  • Корпоративное обучение и поддержка опытного наставника
  • Возможности для развития и карьерного роста
  • Драйвовые мероприятия и подарки к праздникам для сотрудников и их семей

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ

  • Разрабатывать, поддерживать и оптимизировать микросервисную инфраструктуру на базе Kubernetes
  • Проектировать, развёртывать и поддерживать инфраструктуру Prometheus: федерация, sharding, high availability, оптимизация производительности
  • Управлять инфраструктурой через код с использованием Terraform и ArgoCD с использованием GitOps практик
  • Поддерживать работу стека: Kafka, Elasticsearch, Vault, Consul, GitLab, Nexus
  • Поддерживать, разворачивать и настраивать распределенное хранилище Ceph
  • Автоматизировать CI/CD-процессы в GitLab, чинить пайплайны и артефакты
  • Внедрять и настраивать GitOps-практики с использованием ArgoCD для деплоя приложений
  • Автоматизировать рутинные процессы
  • Проактивно видеть проблемы в будущем и предлагать их решение
  • Обеспечивать безопасность, отказоустойчивость и мониторинг платформы
  • Влиять на архитектуру кластеров для повышения её доступности, стабильности и быстродействия
  • Участвовать в расследовании инцидентов, проводить root cause analysis
  • Разрабатывать и поддерживать документацию, стандарты и гайдлайны

ДЛЯ НАС ВАЖНЫ

  • Опыт работы инженером (DevOps/SRE/Platform Engineer) от 2-х лет
  • Глубокие практические знания Kubernetes (развертывание, управление, Helm, операторы, troubleshooting)
  • Глубокие знания Prometheus : архитектура, модель данных, PromQL (включая сложные запросы с агрегацией и функциями), recording rules, alerting rules, service discovery, relabeling, federation
  • Опыт эксплуатации Prometheus в production: настройка retention, оптимизация потребления ресурсов, troubleshooting
  • Уверенная работа с Grafana: разработка сложных дашбордов, variables, provisioning, настройка alerting
  • Понимание принципов работы систем логирования и трассировки
  • Уверенное владение Terraform и понимание принципов IaC (Infrastructure as Code).
  • Опыт настройки и администрирования как минимум трех из перечисленных технологий: Kafka, Elasticsearch, Vault, Consul, Ceph
  • Понимание принципов CI/CD и опыт работы с GitLab CI
  • Знание основ сетей (TCP/IP, DNS, Load Balancing, firewall)
  • Знакомы с ArgoCD для управления деплоями
  • Понимаете принципы CI/CD и DevOps-культуры
  • Готовность работать в команде, участвовать в код-ревью и писать понятный, поддерживаемый код для инфраструктуры

БУДЕТ ПЛЮСОМ

  • Опыт работы с Mimir, Thanos или Cortex
  • Опыт работы с Loki и LogQL
  • Опыт работы с Tempo или Jaeger
  • Знание OpenTelemetry (metrics, logs, traces)
  • Опыт работы с инструментами профилирования (Pyroscope, async-profiler, JFR/JMC)
  • Опыт работы с ArgoCD
  • Знание языков программирования Python, Go на уровне скриптов
  • Опыт работы с облачными провайдерами (DataLine,VK,Yandex,SberCloud)
  • Опыт построения высокодоступных систем
  • Понимание подходов SRE: SLI/SLO/SLA, error budgets
  • Опыт построения высокодоступных систем мониторинга
  • Понимание методологии GitOps


Посмотрите похожие вакансии

SRE инженер (SaaS, e-comm)
Компания: Any
Зарплата: з.п. не указана
Middle+ DevOps-инженер
Компания: Sibedge
Зарплата: з.п. не указана
Инженер платформенных компонентов (DevOps)
Компания: Комус
Зарплата: з.п. не указана