Data Scientist (RecSys / Deep Learning) (удаленная работа)

5 июля 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Scientist (RecSys / Deep Learning)

Описание вакансии

Мы в поиске Middle Data Scientist в команду рекомендательный систем.

Чем предстоит заниматься:

  • Рекомендации на Главной странице (нейросетевые кандидаты, LLM-сценарии, ранжирование)
  • Рекомендации на странице продукта (похожие товары, "с этим товаром покупают", Metric learning, MTMH-кандидаты)
  • Рекомендация размера (размерные эмбеддинги пользователей и товаров)
Мы ожидаем:
  • Подтвержденный опыт в области анализа данных и машинного обучения от 3 лет;
  • Опыт работы с SQL, Hadoop, Hive, Spark;
  • Владение Python, Linux, методами работы с большими данными;
  • Опыт работы с ML библиотеками: Scikit-learn, CatBoost/XGBoost, PyTorch, Spark ML;
  • Знания теории вероятностей и математической статистики;
  • Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
  • Знание алгоритмов и структур данных;
  • Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
  • Английский язык на уровне технического чтения.

Подойдут два профиля:

  1. Плотный коммерческий опыт в RecSys
  2. Нет опыта в RecSys, но есть плотный коммерческий опыт с Deep Learning (работа с NLP, последовательностями, сигналами, временными рядами), и желание применить его в RecSys
Как мы работаем:
  • Пишем на Python 3.6+ и PySpark 3.0;

  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;

  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;

  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;

  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;

  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;

  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.