8 мая 2025
Uzum — это новая уникальная компания в Узбекистане, первая технологичная экосистема сервисов в стране. Мы развиваем сразу несколько высокотехнологичных продуктов, чтобы у миллионов жителей страны был доступ к безграничному ассортименту товаров с быстрой доставкой, а также финансовые сервисы, помогающие в решении бытовых задачи и развитии бизнеса. Мы строим собственную IT-платформу, развиваем систему логистики, привлекая к сотрудничеству сотни тысяч предпринимателей. И сейчас мы в поиске Руководителя направления DevOps/SRE в Data платформу.
Чем предстоит заниматься:
Необходимый опыт и навыки:
1. Инфраструктура и оркестрация
Глубокие знания Terraform / Pulumi, IaC best practices
Опыт проектирования и поддержки Kubernetes кластеров (EKS, GKE, self-managed)
Уверенное владение Helm, Kustomize, ArgoCD или Flux
2. CI/CD
Проектирование и поддержка пайплайнов в GitLab CI, GitHub Actions, Jenkins, Argo Workflows
Управление артефактами и версиями (например, Harbor, Artifactory, Docker Registry)
3. Observability / Monitoring
Настройка мониторинга с использованием Prometheus, Grafana, Loki, Thanos
Логирование через ELK, EFK, OpenTelemetry
Управление алертингом и инцидентами через Alertmanager, PagerDuty, Opsgenie
4. Cloud-платформы
Экспертный уровень в одной или нескольких облачных платформах: AWS, GCP, Azure
Использование сервисов хранения и обработки данных (например, S3, BigQuery, Dataflow, Redshift)
5. DataOps
Поддержка дата-ориентированных решений: Airflow, dbt, Spark, Kafka, ClickHouse, PostgreSQL
Знание специфики CI/CD для data pipeline'ов и ML-платформ
Обеспечение стабильности и восстановления data job'ов
6. Безопасность
Управление секретами: Vault, KMS, Sealed Secrets
Настройка RBAC в Kubernetes, IAM в облаках
Обеспечение комплаенса (например, GDPR, SOC2, ISO 27001) на уровне инфраструктуры
7. Скриптование и автоматизация
Знание Bash, Python
Опыт написания CLI-инструментов и автоматизации задач
8. Архитектура и техническое лидерство
Проектирование отказоустойчивой и масштабируемой инфраструктуры для data-платформ
Code review, менторство, техническая документация
Опыт в построении SRE практик: SLO/SLA, error budgets, chaos engineering
Также:
Надежность и доступность систем (SRE-практики)
Внедрение и развитие практик SRE: SLI/SLO, error budgets, инцидент-менеджмент, пост-мортемы.
Обеспечение высокой доступности и бесперебойной работы ключевых компонентов data-платформы.
Построение и поддержка CI/CD-процессов
Проектирование пайплайнов CI/CD для data-команд с использованием GitLab CI, Argo Workflows и других инструментов.
Обеспечение стабильной доставки изменений в production среду.
Менторство и развитие DevOps-инженеров
Наставничество, код-ревью и развитие технических компетенций команды DevOps.
Участие в формировании команды, найме и онбординге новых инженеров.
Продвижение инженерных практик, культуры ответственности и DevOps-методологий.
Инфраструктурная безопасность и комплаенс
Управление доступами и секретами (Vault, KMS, RBAC/IAM).
Observability и инцидент-менеджмент
Развитие системы мониторинга, логирования и трассировки (Prometheus, Grafana, Loki, OpenTelemetry).
Настройка алертов и дежурств, обеспечение оперативного реагирования на инциденты.
Работа в связке с data-инженерами и аналитиками для ускорения и стабилизации ETL/ML процессов.
Техническое лидерство и участие в архитектурных решениях
Участие в стратегическом планировании архитектуры платформы.
Ведение технической документации и участие в архитектурных комитетах.
Мы предлагаем: