Привет! Это команда вертикальных поисков. Современный поиск на маркетплейсе это не плоский список из тысяч карточек, а умная витрина, которая понимает намерение пользователя и сама группирует товары по тому, что ему важно. Покупатель, который вбивает ноутбук , на самом деле ищет игровой , для учёбы ребёнку или тонкий для работы и наша задача показать ему эти тематические полки прямо в выдаче, без лишних кликов и фильтров. Мы называем такие полки нави-колдунами это автоматически собираемые кластеры товаров внутри поисковой выдачи, которые упорядочивают её по понятным пользователю осям: сценарий использования, ценовой сегмент, тип покупателя, ключевая характеристика. Каждый колдун имеет название, описание и подборку релевантных товаров. Мы ищем DS-специалиста, который будет развивать стрим нави-колдунов: от выделения семантических осей категории до продакшн-ранжирования полок в реальной выдаче Ozon.
Вы будете:
Разрабатывать и внедрять модели кластеризации товаров для построения тематических полок в поисковой выдаче.
Проектировать пайплайны автоматической генерации названий и описаний кластеров (в т.ч. с использованием LLM).
Строить модели ранжирования полок и товаров внутри полок под интент пользователя.
Работать с товарными эмбеддингами, признаками поведения пользователей и атрибутами карточек для повышения качества кластеризации.
Заниматься построением пайплайнов обработки и сбора данных, разметкой и обучением моделей.
Участвовать в полном ML-цикле: от исследования и создания прототипов до продакшн-внедрения, A/B-тестов и мониторинга моделей.
Нам важно:
Наличие фундаментальной математической базы, знание алгоритмов, математической статистики, классического ML и нейросетей.
Понимание методов кластеризации, построения эмбеддингов и алгоритмов ранжирования (LTR).
Опыт работы с современными архитектурами языковых моделей и эмбеддинг-моделей, в том числе обучение/дообучение своих моделей.
Опыт работы с продуктами в области поиска, рекомендательных систем или рекламных технологий.
Понимание принципов оценки качества ML-моделей в проде, постановки и анализа A/B-тестов.
Будет плюсом:
Опыт построения ассистентов или продуктов на базе LLM, генерация структурированного контента (названий/описаний).
Знание технологий обработки больших данных, таких как Hadoop, Spark или аналогичные.
Навыки работы с инструментами автоматизации ML-пайплайнов.
Опыт работы с e-commerce данными: товарные графы, каталоги, пользовательские сессии.