24 апреля 2024
Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входит Лента.ру , Газета.Ru , Championat.com, портал Рамблер , Секрет фирмы и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий.
Проект - рекомендательная система, которая подбирает для пользователей наиболее релевантный контент, повышая продуктовые метрики. Рекомендации строятся в рантайме на каждый заход пользователя на страницу с рекомендациями.
Решаем з адачи со всех этапов разработки ML-моделей: от экспериментов с новыми фичами и написания пайплайнов загрузки логов до выкатки моделей в нагруженный прод и добавления новых мониторингов.
Команда состоит из 22 человек: DS (6 человек), DA, DE, backend, frontend, PM.
Стек технологий:
ML: numpy, pandas, scikit-learn, xgboost (переезжаем на catboost), implicit, pytorch, deep pavlov, natasha, gensim, mlflow
DE: hadoop, hive, pyspark, spark structured streaming, kafka, postgres, clickhouse, redis
Py: python, asyncio, fastapi
Ещё: airflow, grafana, superset, sentry, gitlab, jira, confluence
Что мы ценим и ищем?
Будет плюсом:
Мы предлагаем: