20 октября 2024
Мы компания Цифровые сервисы , разрабатываем новые крутые высоконагруженные информационные системы и приложения для сотрудников ОАО РЖД , а также реализуем проекты на базе исследований и изобретений Сочинского R&D центра ОЦРВ.
Ищем опытного ML/DS специалиста для работы над новым перспективным долгосрочным проектом Адаптационный интеллектуальный помощник для сотрудников ОАО РЖД (автоматическая система помощи адаптации персонала с применением искусственного интеллекта).
Основная задача чат-бота - помощь новым сотрудникам на этапе адаптации с целью ускорения данного процесса, предоставление ответов на вопросы сотрудников, опираясь на базу знаний, оптимизация временных затрат руководителей и наставников новичка на адаптацию.
Интеллектуальный помощник разрабатывается с использованием передовых технологий, с применением Open Sourse фреймворка RASA на Python.
В перспективе планируется дальнейшее масштабирование проекта, подключение новых баз знаний и функциональностей.
Стадия проекта: начальная стадия разработки.
Задачи, над которыми предстоит работать:
Разработка диалогового движка интеллектуального помощника.
Дообучение моделей распознавания и генерации речи.
Разработка и внедрение моделей NLP, в том числе на базе больших языковых моделей.
Реализация логики пред/постобработки данных и результатов работы ML-моделей.
Реализация сервисов интеллектуального помощника и упаковка их в Docker-контейнеры.
Участие в разработке архитектуры решения.
Выбор технологии, языка программирования, библиотек и т.п.
Поддержка в актуальном состоянии документации по экспериментам и разработанному коду.
Стек и технологии Проекта: Python, RASA, PyTorch, Transformers, LLM, Vosk, Whisper, ONNX, Docker/Kubernetes, PostgreSQL, Weights & Biases (Wandb).
Мы ожидаем от кандидата:
Опыт работы в области разработки и внедрения моделей машинного обучения в области NLP от 3-х лет.
Знание основных алгоритмов машинного обучения, глубокого обучения, больших языковых моделей.
Понимание цикла разработки решений с использованием моделей машинного обучения.
Понимание основных метрик оценки качества ML-моделей.
Опыт работы с библиотеками: TensorFlow, Keras, PyTorch, RASA, transformers, torchaudio, spaCy, Scikit-learn, nltk, pandas.
Понимание алгоритмов оптимизации и сжатия моделей.
Опыт интеграции моделей в продуктивный код.
Практические навыки работы с инструментами MLOps, CI/CD, Git, GitLab, Docker/Kubernetes.
Английский язык на уровне чтения статей.
Высшее образование в области компьютерной лингвистики, математики, физики, или смежной дисциплине.
Будет плюсом:
Опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться.
Опыт работы с моделями / продуктами на основе TTS/ASR (wosk-tts, whisper или иными).
Мы предлагаем:
Работу в стабильной аккредитованной Минцифрой IT-компании, которая занимается разработкой ПО для ОАО "РЖД".
Работу в классной дружной команде единомышленников, которая поможет во всех сложностях и поддержит самые дерзкие идеи и инициативы.
Трудоустройство по ТК РФ, белую зарплату.
Достойный уровень заработной платы. Оклад, зависящий от уровня профессиональных компетенций.
Ежегодную индексацию заработной платы.
Возможность работать в форматах работы гибрид / офис / удаленный в рамках РФ.
График работы: пятидневная рабочая неделя, начало рабочего дня по договоренности с руководителем проекта в период с 9:00 до 11:00 МСК.
ДМС со стоматологией после испытательного срока.
Компенсация обедов по электронным картам.
Комфортный офис в центре Москвы (2 мин. от м. Красные ворота).
Отсутствие дресс-кода.
Возможность участия в спортивных мероприятиях, организованных компанией.