В Управление инженерных практик в рамках внедрения сервисного подхода в ИТ процессах ищем Junior DevOps-инженера
Чем предстоит заниматься:
Мониторинг и реагирование на инциденты (первая линия)
Отслеживание состояния инфраструктуры через системы мониторинга (Grafana, Alertmanager); приём и классификация алертов; первичная диагностика по runbook; эскалация на L2/L3 при невозможности самостоятельного решения
Перезапуск сервисов и подов в Kubernetes по инструкции; проверка статусов деплоев; выполнение стандартных процедур обслуживания (ротация логов, очистка дискового пространства, перезапуск агентов мониторинга)
Поддержка CI/CD пайплайнов
Мониторинг выполнения пайплайнов сборки и деплоя (Jenkins, GitLab); перезапуск упавших джобов; фиксация и эскалация повторяющихся ошибок; помощь разработчикам в типовых вопросах по пайплайнам.
Базовое администрирование Kubernetes
Проверка состояния подов, нод и сервисов (kubectl get/describe/logs); выполнение масштабирования реплик по запросу; перезапуск зависших подов; сбор диагностической информации для L2.
Работа с системами наблюдаемости
Просмотр и анализ метрик и логов в Grafana/Prometheus/ELK;обновление простых дашбордов; проверка срабатывания алертов; участие в настройке порогов алертинга под руководством старших инженеров
Ведение эксплуатационной документации
Актуализация runbook и инструкций на основе опыта инцидентов; фиксация действий при обработке инцидентов; заполнение карточек инцидентов в системе учёта (Jira/Confluence)
Управление доступами и запросами
Обработка запросов на предоставление/отзыв доступов по установленным процедурам; выполнение чек-листов при подключении новых сервисов; базовое управление секретами (по инструкции)
Взаимодействие с командами разработки
Приём обращений от разработчиков по вопросам инфраструктуры; маршрутизация запросов на нужный уровень поддержки; помощь в типовых вопросах (подключение к кластеру, доступ к логам, статусы деплоев)
Нам важно:
Базовые знания Linux (командная строка, файловая система, процессы, логи, сетевые утилиты: ping, curl, netstat, ss)
Понимание основ контейнеризации (Docker): что такое образ, контейнер, реестр; умение запустить/остановить контейнер, посмотреть логи
Базовые навыки работы с Kubernetes: kubectl get/describe/logs/exec, понимание основных сущностей (pod, deployment, service, namespace)
Знакомство с CI/CD: понимание концепции пайплайна, умение читать логи сборок в Jenkins/GitLab CI, перезапуск джобов
Умение работать с Grafana: навигация по дашбордам, чтение графиков, понимание основных метрик (CPU, RAM, disk, latency)
Знание Git на базовом уровне: clone, pull, commit, push, работа с ветками.
Навыки работы с тикет-системами (Jira) и wiki (Confluence): создание задач, ведение документации
Умение работать по runbook: чёткое следование инструкциям, фиксация отклонений, своевременная эскалации
Желательные требования:
Знакомство с Helm: понимание концепции чартов, умение выполнить helm list / helm status
Базовые знания сетей: TCP/IP, DNS, HTTP/HTTPS, понимание сетевых проблем (таймауты, connection refused)
Знакомство с ELK/Loki для поиска и анализа логов
Понимание основ информационной безопасности: RBAC, секреты, принцип наименьших привилегийGit
Допускается отсутствие коммерческого опыта при наличии профильного образования, прохождения курсов или лабораторного опыта (home lab, pet-проекты)
Готовность к дежурному графику (при необходимости).
Участие в процессах Agile/Scrum приветствуется, но не является обязательным