Вакансия: Team Lead MLOps
Описание вакансии
О роли
Мы ищем Team Lead MLOps Engineer, который возглавит развитие MLOps-направления, обеспечит стабильную работу ML-инфраструктуры и создаст эффективные процессы разработки, тестирования и развертывания моделей. Если ты готов управлять командой, внедрять передовые практики и строить масштабируемые решения, мы будем рады видеть тебя в нашей команде.
Ты будешь отвечать за платформу для разработки и внедрения моделей машинного обучения, которая уже сегодня поддерживает все наши текущие ML-решения. От того, насколько быстро и эффективно она будет развиваться, зависит успех всей ML-команды Звука. Твоя работа станет ключевым звеном в создании продуктов, которые меняют представление о музыке.
Почему это важно
Наша цель создавать надежные и инновационные ML-решения, которые помогают бизнесу достигать новых высот. Мы стремимся к тому, чтобы наши модели работали быстро, стабильно и эффективно, а команды могли сосредоточиться на создании лучших продуктов.
Чем будешь заниматься у нас:
- Руководить командой MLOps: управлять, наставлять и развивать инженеров.
- Создавать и внедрять MLOps-практики: стенды, DevOps-процессы, среды разработки, тестирования, инференса и мониторинга моделей (Batch, Streaming, CPU/GPU).
- Развивать LLMOps-практики: оптимизировать инференс LLM для ChatGPT-like решений.
- Внедрять и поддерживать инструменты версионирования артефактов (ClearML, MLFlow, DVC и др.).
- Помогать команде Data Scientists в выводе моделей в прод.
- Развивать CI/CD и DAG-пайплайны для разработки, тестирования и инференса моделей.
Технологии, с которыми будешь работать: k8s, Flux2, Airflow, Redis, Qdrant, ClearML, FastAPI, MongoDB, Spark, Kafka, Prometheus, Grafana.
Успех в этой роли обеспечат:
- Опыт работы в качестве DevOps/MLOps/ML Engineer не менее 4 лет.
- Опыт управления командой: планирование задач, код-ревью, развитие сотрудников.
- Глубокие знания k8s: умение разрабатывать и поддерживать сервисы в этой среде.
- Опыт работы с MLOps-инструментами (ClearML, DVC, MLflow и др.).
- Навыки отладки Spark-job'ов и понимание ML-алгоритмов (бустинги, сетки, LLM, распределенные вычисления).
- Знание принципов организации распределенных информационных систем и баз данных.
Будет плюсом:
- Опыт работы с векторными базами данных (Qdrant, Milvus или аналогами).
- Знания в области Feature Store и обеспечения потоков данных.
- Опыт оптимизации GPU-инференса для LLM.
- Навыки разработки REST-сервисов.