Senior Data Scientist (Старший специалист по машинному обучению) (удаленная работа)
(вакансия не опубликована)

5 июня 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Senior Data Scientist (Старший специалист по машинному обучению)

Описание вакансии

О проекте

  • Прогнозирование вероятности наличия второй сим-карты
  • Улучшение матчинга двух и более сим-карт МегаФона на одного абонента
  • Работа с оттоком абонентов, имеющими 2 и более сим-карты
  • Участие в проекте выделения домохозяйств/кругов общения

Стек

  • Python (Classic ML: numpy, pandas, sklearn, catboost)
  • SQL (Oracle, PL/SQL)
  • Hadoop (Hive, Spark, etc.)
  • MLOps (MLflow, Airflow, GitLab CI/CD)

Какие задачи необходимо решать

  • Написание production-ready кода для автоматизации скоринга и офферинга
  • Оценка эффектов на бизнес-KPI как для существующих, так и для потенциальных решений
  • Участие во всех этапах жизненного цикла ML-продуктов от бизнес-анализа до имплементации и поддержки готовых решений
  • Разработка моделей машинного обучения на основе табличных данных (классификация, регрессия, мультикласс, мультилейбл)
  • Генерация гипотез, дизайн и проведение A/B тестов

Что для этого нужно

  • Релевантный опыт работ от 3-х лет
  • Уверенные знания алгоритмов машинного обучения, принципов их работы, ключевых особенностей и ограничений
  • Понимание принципов работы с сильным дисбалансом классов
  • Отличное владение инструментами анализа данных, библиотеками машинного обучения, Python
  • Наличие успешно завершенных проектов с использованием технологий анализа данных и машинного обучения
  • Понимание принципов работы экосистемы Hadoop и опыт работы с ней (Hive, PySpark), умение делать feature engineering на больших данных
  • Знания в области статистики и A/B-тестирования

Плюсом будет

  • Опыт работы с моделями причинно-следственных связей (causal inference, uplift и др.)
  • Опыт применения интерпретируемых ML-моделей
  • Опыт работы с MLOps
  • Умение составлять работающие графовые признаки для ML-моделей