Вакансия: Senior ML-инженер/MLOps
Описание вакансии
OneTwoTrip современный и технологичный онлайн-сервис для организации путешествий, работающий на мировом рынке 14 лет. Благодаря работе команды OneTwoTrip на сайте и в мобильном приложении можно найти и забронировать номер в одном из 2 000 000 отелей и апартаментов по всему миру, купить авиабилет одной из 800 авиакомпаний, оформить билет на поезд или автобус по России и странам СНГ, арендовать автомобиль и заказать экскурсию с гидом. Ежедневно мы работаем для того, чтобы десятки миллионов поисковых запросов превращались в десятки тысяч путешествий.
Клиентами OneTwoTrip являются более 10 000 000 человек.
Мы ищем Senior ML-инженера/ MLOpsа, который усилит DS-команду и сделает ML-сервис, пайплайны данных и процесс выката моделей более надёжными, наблюдаемыми и предсказуемыми.
ML-контекст обязателен : нужно понимать жизненный цикл модели, train/serve, версионирование, мониторинг скоров и фичей. Иногда можно подхватывать некритичные модели, но ядро роли инженерия вокруг ML.
Команда небольшая и растёт. У каждого своё крупное направление с амбициозными задачами. Свобода действий максимальная: вы сами принимаете решения по подходам и архитектуре, ведёте направление от исследования до прода и видите результат в метриках.
Здесь нет бюрократии возможность выстраивать ML-инфраструктуру с высокой степенью самостоятельности: архитектурные решения, выбор инструментов, технические стандарты. Есть и наставничество, и пространство для роста и в технике, и в бизнес-мышлении.
Чем предстоит заниматься:
- Поддерживать и развивать Python ML-сервис с несколькими моделями и эндпоинтами: latency, API-контракты, connection pooling, безопасная диагностика, обратная совместимость
- Развивать SQL/batch-пайплайны и синхронизацию фич из DWH в PostgreSQL для online inference: freshness, проверки качества данных, идемпотентность, backfill
- Улучшать production ML-процессы : артефакты и версии моделей, rollback, prediction logging, мониторинг latency/errors по моделям и эндпоинтам
- Общаться с DevOps/backend/product: формулировать конкретные технические запросы, договариваться о логах/метриках/доступах, не перекладывать диагностику приложения на смежников.
Что для нас важно:
- От 3-х лет опыта на стыке production Python, данных и ML в проде
- Python web-сервисы в проде : Flask/FastAPI + Gunicorn или аналог; latency, I/O-bound vs CPU-bound, API-контракты, обратная совместимость
- Уверенный SQL : оконные функции, витрины, инкрементальная логика, идемпотентность job
- Понимание batch vs online : sync DWH Postgres, freshness, late data, backfill
- Production ML : версии артефактов, rollback за минуты, понимание train/serve skew и shadow/canary/A/B
- Observability : что логировать на prediction, что сэмплировать, алерты без деградации сервиса
- Работа с DevOps/backend/product: конкретные запросы, договорённости, без перекладывания диагностики
Будет плюсом :
- Опыт работы с Airflow; Spark/Kafka/streaming
- Ownership направления : опыт самостоятельного ведения инженерного направления от диагностики до результата
- Понимание A/B на уровне инженера, который поддерживает эксперименты
Мы предлагаем:
А также интересные корпоративы, вечеринки, тревел-офисы и многое другое, о чем мы готовы рассказать вам на интервью!
Ждем ваших откликов :)