DevOps-инженер (Трайб Data Office) (удаленная работа)

5 апреля 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: DevOps-инженер (Трайб Data Office)

Описание вакансии

Кого мы ищем? Мы в Банке строим ML-платформу нового поколения инфраструктуру, которая обеспечивает полный MLOps-цикл: от экспериментов до продакшн-инференса. Это не просто среда для Data Scientists это полноценная экосистема, в которой уже преднастроены фреймворки для анализа, обработки данных, мониторинга и оркестрации ML-процессов. Сейчас мы в поиске DevOps-инженера, который станет частью команды и поможет спроектировать и развернуть отказоустойчивую, масштабируемую ML-платформу на базе Kubernetes с нуля. У нас масштабные задачи, свежий стек и высокий уровень свободы в реализации идей.

Наш стек:

  • Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Hive), Seldon, Kubeflow
  • ML сервисы: Kubeflow, MLFlow, Airflow
  • БД и очереди: HDFS, PostgreSQL, Kafka, Redis, Minio
  • Управление инфраструктурой: Ansible, ArgoCD
  • CI/CD: Bitbucket, Teamcity, Nexus
  • Мониторинг: Grafana, Zabbix

Чем предстоит заниматься?

  • Разворачивать и настраивать инфраструктуру для тренировки и сервинга ML-моделей;
  • Внедрять и развивать ML-компоненты в концепции Model-as-a-Service;
  • Разрабатывать backend-часть для моделей: API, обработку запросов, масштабирование, мониторинг;
  • Автоматизировать развёртывание сервисов через CI/CD пайплайны;
  • Настраивать логирование, мониторинг и алерты;
  • Проводить R&D и внедрять перспективные open-source решения.

Что мы ожидаем?

  • Опыт администрирования Linux (RHEL, CentOS) от 2-х лет;
  • Глубокие знания Kubernetes (развертывание, обновление в закрытых средах);
  • Опыт работы с GPU;
  • Понимание MLOps практик;
  • Уверенное владение инструментами CI/CD;
  • Навыки автоматизации с помощью Python/Bash;
  • Опыт эксплуатации систем мониторинга (Prometheus, Grafana, Zabbix, ELK).