Старший Data Scientist, ML ценообразование (удаленная работа)

4 апреля 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Старший Data Scientist, ML ценообразование

Описание вакансии

Привет! Это команда ML ценообразования. Сейчас в команде 2 человека, которые сделали MVP на A/B тестах стабильно позитивные результаты. Основная цель на ближайшее время определить стратегию дальнейшего развития системы. Цель на долгосрок разработать устойчивое решение, которое учитывает не только краткосрочную выгоду, но и сайд-эффекты и последствия. Сейчас пайплайн переводится с hadoop в сервисы, и в дальнейшем поддержкой production и всей технической стороной проекта будет заниматься соседняя команда, а мы сосредоточимся на математической составляющей задачи.

Этот проект борьба с шумными данными, сложными метриками и неочевидными решениями. Мы ищем человека, который готов бороться за каждую десятую процента на А/Б, за качество и безопасность решений, за долгосрочный эффект. Который не ищет легких путей, но хочет побеждать вместе с командой. Если процесс преодоления доставляет вам особое удовольствие, и вы хотите привнести в сильную команду свое видение нам точно стоит познакомиться!

Вы будете

  • Анализировать большие объёмы данных с помощью PySpark для поиска неочевидных закономерностей.
  • Исследовать и улучшать ML-решения на реальных шумных данных от гипотезы до оценки влияния на А/Б-тесты (без погружения в production-инженерию: пайплайн и поддержку возьмёт соседняя команда).
  • Разрабатывать и проверять новые факторы для моделей, добиваясь стабильного прироста метрик.
  • Проектировать эксперименты и инструменты валидации, чтобы отделить реальный эффект от шума и случайностей.
  • Оценивать долгосрочные последствия решений, выявлять и анализировать сайд-эффекты.
  • Участвовать в архитектурных обсуждениях (как лучше строить фичи, валидацию, сценарии использования) без рутинной поддержки кода в проде.

Нам важно

  • Отличная математическая база.
  • Коммерческий опыт в DS от 4 лет обязательно с задачами, где данные были шумными или недостаточно разнообразными.
  • Опыт работы с PySpark на реальных объёмах данных (именно для анализа и генерации фичей, а не для написания production-пайплайнов).
  • Опыт постановки и интерпретации А/Б-тестов.
  • Умение и желание копать в глубину: не остановиться на первом сработавшем решении, а проверять устойчивость, смотреть на сайд-эффекты, пробовать альтернативные подходы.
  • Прагматизм и ориентацию на результат умение быстро проверять гипотезы, при этом не скатываясь в бесконечный research.

Будет плюсом

  • Опыт в ML ценообразовании.
  • Опыт успешного применения Causal Inference подходов.