ML/DS специалист, направление NLP (Senior) (удаленная работа)

20 октября 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: ML/DS специалист, направление NLP (Senior)

Описание вакансии

Мы компания Цифровые сервисы , разрабатываем новые крутые высоконагруженные информационные системы и приложения для сотрудников ОАО РЖД , а также реализуем проекты на базе исследований и изобретений Сочинского R&D центра ОЦРВ.

Ищем опытного ML/DS специалиста для работы над новым перспективным долгосрочным проектом Адаптационный интеллектуальный помощник для сотрудников ОАО РЖД (автоматическая система помощи адаптации персонала с применением искусственного интеллекта).

Основная задача чат-бота - помощь новым сотрудникам на этапе адаптации с целью ускорения данного процесса, предоставление ответов на вопросы сотрудников, опираясь на базу знаний, оптимизация временных затрат руководителей и наставников новичка на адаптацию.

Интеллектуальный помощник разрабатывается с использованием передовых технологий, с применением Open Sourse фреймворка RASA на Python.

В перспективе планируется дальнейшее масштабирование проекта, подключение новых баз знаний и функциональностей.

Стадия проекта: начальная стадия разработки.

Задачи, над которыми предстоит работать:

  • Разработка диалогового движка интеллектуального помощника.

  • Дообучение моделей распознавания и генерации речи.

  • Разработка и внедрение моделей NLP, в том числе на базе больших языковых моделей.

  • Реализация логики пред/постобработки данных и результатов работы ML-моделей.

  • Реализация сервисов интеллектуального помощника и упаковка их в Docker-контейнеры.

  • Участие в разработке архитектуры решения.

  • Выбор технологии, языка программирования, библиотек и т.п.

  • Поддержка в актуальном состоянии документации по экспериментам и разработанному коду.

Стек и технологии Проекта: Python, RASA, PyTorch, Transformers, LLM, Vosk, Whisper, ONNX, Docker/Kubernetes, PostgreSQL, Weights & Biases (Wandb).

Мы ожидаем от кандидата:

  • Опыт работы в области разработки и внедрения моделей машинного обучения в области NLP от 3-х лет.

  • Знание основных алгоритмов машинного обучения, глубокого обучения, больших языковых моделей.

  • Понимание цикла разработки решений с использованием моделей машинного обучения.

  • Понимание основных метрик оценки качества ML-моделей.

  • Опыт работы с библиотеками: TensorFlow, Keras, PyTorch, RASA, transformers, torchaudio, spaCy, Scikit-learn, nltk, pandas.

  • Понимание алгоритмов оптимизации и сжатия моделей.

  • Опыт интеграции моделей в продуктивный код.

  • Практические навыки работы с инструментами MLOps, CI/CD, Git, GitLab, Docker/Kubernetes.

  • Английский язык на уровне чтения статей.

  • Высшее образование в области компьютерной лингвистики, математики, физики, или смежной дисциплине.

Будет плюсом:

  • Опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться.

  • Опыт работы с моделями / продуктами на основе TTS/ASR (wosk-tts, whisper или иными).

Мы предлагаем:

  • Работу в стабильной аккредитованной Минцифрой IT-компании, которая занимается разработкой ПО для ОАО "РЖД".

  • Работу в классной дружной команде единомышленников, которая поможет во всех сложностях и поддержит самые дерзкие идеи и инициативы.

  • Трудоустройство по ТК РФ, белую зарплату.

  • Достойный уровень заработной платы. Оклад, зависящий от уровня профессиональных компетенций.

  • Ежегодную индексацию заработной платы.

  • Возможность работать в форматах работы гибрид / офис / удаленный в рамках РФ.

  • График работы: пятидневная рабочая неделя, начало рабочего дня по договоренности с руководителем проекта в период с 9:00 до 11:00 МСК.

  • ДМС со стоматологией после испытательного срока.

  • Компенсация обедов по электронным картам.

  • Комфортный офис в центре Москвы (2 мин. от м. Красные ворота).

  • Отсутствие дресс-кода.

  • Возможность участия в спортивных мероприятиях, организованных компанией.