Что нужно делать:
имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
эксперименты по созданию новых архитектур, оценка языковых моделей;
работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;
речевая аналитика (оценка качества работы операторов, формирование рекомендации);
анализ обращений и отзывов;
разработка чат-ботов;
применение ML/DL на KG и базах знаний;
тестирование данных, гипотез, моделей;
доведение разработанной модели до вывода в production;
плотно общаться с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
разрабатывать system design решений;
управлять полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.
высшее техническое/математическое образование;
опыт работы DS от 3 лет;
понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
опыт работы с языковыми моделями, понимание подходов к обучению LLM;
хорошее понимание современных архитектур нейронных сетей;
умение читать и разбирать статьи о новых архитектурах и подходах;
понимание принципов обучения, тюнинга, оценки deep learning моделей;
опыт отладки нейронных сетей и модификации архитектур или создания собственных;
опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
понимание принципов ведения разработки, ведения документации;
умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
способность самостоятельно делать R&D в новых темах;
умение работать в команде;
уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git.
Желательно:
опыт работы pyspark, airflow;
опыт распределенного обучения на нескольких GPU и серверах;
опыт оптимизации или сжатия/дистилляции моделей (прунинг, квантование, onnx);
опыт воспроизведения статей в коде;
наличие публикаций по Deep Learning;
участие в конференциях.