Data Scientist LLM (удаленная работа)

27 апреля 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Scientist LLM

Описание вакансии

Что нужно делать:
имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
эксперименты по созданию новых архитектур, оценка языковых моделей;
работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;

речевая аналитика (оценка качества работы операторов, формирование рекомендации);
анализ обращений и отзывов;
разработка чат-ботов;
применение ML/DL на KG и базах знаний;
тестирование данных, гипотез, моделей;
доведение разработанной модели до вывода в production;
плотно общаться с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
разрабатывать system design решений;
управлять полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.

Наши ожидания от кандидата:

высшее техническое/математическое образование;
опыт работы DS от 3 лет;
понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
опыт работы с языковыми моделями, понимание подходов к обучению LLM;
хорошее понимание современных архитектур нейронных сетей;
умение читать и разбирать статьи о новых архитектурах и подходах;
понимание принципов обучения, тюнинга, оценки deep learning моделей;
опыт отладки нейронных сетей и модификации архитектур или создания собственных;

опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
понимание принципов ведения разработки, ведения документации;
умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
способность самостоятельно делать R&D в новых темах;
умение работать в команде;
уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git.

Желательно:
опыт работы pyspark, airflow;
опыт распределенного обучения на нескольких GPU и серверах;
опыт оптимизации или сжатия/дистилляции моделей (прунинг, квантование, onnx);
опыт воспроизведения статей в коде;
наличие публикаций по Deep Learning;
участие в конференциях.



Посмотрите похожие вакансии

Data Scientist (LLM / NLP направления)
Компания: АТОН
Зарплата: з.п. не указана
Data Scientist (NLP)
Компания: МегаФон
Зарплата: з.п. не указана
Senior Data Scientist (NLP, LLM)
Компания: Газпромбанк
Зарплата: з.п. не указана
Middle Data Scientist
Компания: ЛАНИТ
Зарплата: з.п. не указана