Вакансия: Ведущий Data Scientist, Ранжирование поиска
Описание вакансии
Наша команда занимается разработкой сервисов для поиска на сайте Ozon: находим и ранжируем товары, формируем поисковые подсказки, исправляем опечатки.
Мы отвечаем за весь pipeline сбора данных, обучение моделей ранжирования, проведение и анализ новых экспериментов. Работаем по Agile с двухнедельными спринтами.
Общие задачи:
Глобально- это улучшение моделей поиска: добавление новых признаков, изменение логики ранжирования (как пример - уменьшение среднего времени доставки заказанного товара), улучшение Unit-экономики за счет оптимизации соответствующих метрик. Улучшение качества ранжирования в отдельных категориях / разделах сайта, технические задачи, связанные с архитектурой расчета и обновления признаков, тестиования различных типов моделей и другое.
Наш стек:
- Python, Pyspark, Clickhouse, Airflow, Mlflow, xgboost.
Вам предстоит:
- Заниматься полным циклом DS/ML задач для улучшения качества алгоритма ранжирования товаров в поисковой выдаче.
- Работать с данными от их исследования до автоматизации пайплайнов для регулярных расчетов датасетов и фичей на pyspark.
- Искать подходящие ML решения для бизнес-задач, планировать и проводить оффлайн и онлайн (А/Б) эксперименты.
- Примеры задач:
- Оптимизация сложных целей компании с помощью ранжирования (multi-objective ranking, дизайн композитных функций потерь).
- Устранение различных bias-ов из моделей (positional bias, cold start problem).
- Дизайн и разработка оффлайн-метрик, которые будут хорошо предсказывать результаты А/Б экспериментов.
- Адаптация алгоритмов под нужды отдельных товарных категорий (одежда, продукты).
Мы ожидаем:
-
Опыт работы в Data Science от 3х лет.
-
Уверенные теоретические знания ML.
-
Сильный Python.
-
Уверенное знание hadoop - стека, опыт работы с большими данными.
Как плюс:
- Опыт работы с рекомендательными системами или NLP.
- Опыт работы с высоконагруженными системами.
- Опыт дизайна и проведения AB тестов.
Мы предлагаем:
- В первую очередь интересные задачи. Примеры проблем, с которыми борется наша команда: "холодный старт" товаров и запросов (как понять, куда поставить товар в выдаче, когда у нас нет по нему статистики); позиционный и другие bias в ранжировании (товары, которые стоят выше, видят чаще, поэтому у них больше "хорошей" статистики); релевантность vs заказы (зачастую люди покупают мелочевку и аксессуары, но хотят видеть в топе основные и дорогие товары); предсказание категории, типа товара и других сущностей по тексту запроса.
- Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
- Свободу действий в принятии решений.
- Достойный уровень заработной платы.
- Профессиональную команду, которой мы гордимся.
- Возможность развиваться вместе с нашим бизнесом.