Senior Data Scientist (NLP, LLM) (удаленная работа)

1 мая 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Senior Data Scientist (NLP, LLM)

Описание вакансии

Команда Департамента Анализа данных и моделирования нацелена на максимально эффективное использование данных. Мы верим, что можем сделать Банк лучшим для внутреннего и внешнего клиента за счет датацентричности и проникновения моделирования во все сферы деятельности.

Управление алгоритмов машинного обучения занимается развитием компьютерного зрения, речевых технологий, графов и гео.

Задачи, которые мы тебе доверим:
имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
эксперименты по созданию новых архитектур, оценка языковых моделей;
работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;

речевая аналитика (оценка качества работы операторов, формирование рекомендации);
анализ обращений и отзывов;
разработка чат-ботов;
применение ML/DL на KG и базах знаний;
тестирование данных, гипотез, моделей;
доведение разработанной модели до вывода в production;
общение с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
разработка system design решений;
управление полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.

Наши ожидания от кандидата:

высшее техническое/математическое образование;
опыт работы DS от 3 лет;
понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
опыт работы с языковыми моделями, понимание подходов к обучению LLM;
хорошее понимание современных архитектур нейронных сетей;
умение читать и разбирать статьи о новых архитектурах и подходах;
понимание принципов обучения, тюнинга, оценки deep learning моделей;
опыт отладки нейронных сетей и модификации архитектур или создания собственных; опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
понимание принципов ведения разработки, ведения документации;
умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
способность самостоятельно делать R&D в новых темах;
умение работать в команде;
уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git.

Что мы предлагаем:

полностью удаленный формат работы из любого города;

уровень зп обсуждается по итогу собеседования, но у нас также есть премиальная и бонусная система выплат и регулярные процедуры пересмотра уровня зп и грейда;

возможность прокачать персональный бренд, участвуя в профессиональных конференциях и делая публикации с помощью команды DevRel.