25 апреля 2026
Аскона крупная федеральная компания с более чем 35-летней историей. Мы производим и продаём мебель, товары для дома и уюта по России и странам СНГ. Сильный бренд, собственное производство, выстроенные бизнес-процессы и понятные стандарты работы обеспечивают стабильность и прогнозируемый результат.
Для обеспечения стабильной работы production-систем Askona Ecom через построение и управление процессом Incident Management ищем Team Lead SL2.Управлять процессом Incident Management end to end: классификация, приоритизация, маршрутизация инцидентов, контроль соблюдения SLA
Координировать решение Blocker/Critical инцидентов (организация War Room, эскалация при нарушении SLA)
Проводить Post Mortem для Blocker/Critical инцидентов в течение 48 часов после закрытия
Обеспечивать первичную диагностику инцидентов на уровне L2 и решать типовые инциденты (config changes, перезапуск сервисов, workarounds)
Создавать и поддерживать актуальные Runbooks и базу знаний по типовым инцидентам и их решениям
Готовить отчётность: еженедельные отчёты по инцидентам для CTO и Team Leads, ежемесячные обзоры с анализом трендов для CTO и CPO, квартальный анализ трендов
Руководить командой Support L2 (1 2 специалиста): организовывать on call ротацию, обучать и развивать сотрудников, проводить 1:1 и performance review, участвовать в найме
Отслеживать ключевые метрики (MTTR, SLA compliance, reopen rate), выявлять системные проблемы и предлагать preventive actions
Общий опыт: не менее 5 лет в IT, из них не менее 3 лет в support / SRE / DevOps / production operations
Управленческий опыт: не менее 1 года руководства командой; опыт работы с ITIL / Incident Management (обязательно), в e commerce (желательно)
Операционные навыки: уверенное владение инструментами мониторинга (Grafana, Zabbix, Prometheus) и логирования (ELK, Loki, Kibana), умение настраивать алерты и анализировать логи
Технические компетенции: базовые навыки работы с SQL (запросы для диагностики), Docker и Kubernetes (просмотр pods/logs, понимание контейнеризации), а также понимание принципов CI/CD (pipeline, rollback, canary deploy) и REST API (работа с HTTP, тестирование через curl/Postman)
Знание ITIL v4: глубокое понимание и практический опыт внедрения процессов Incident Management
Будет преимуществом: опыт внедрения Incident Management с нуля, знание SRE практик (SLI/SLO/SLA, error budgets), языков программирования (Go/Python/JavaScript на уровне чтения кода), а также опыт настройки систем обзвона