28 октября 2024
Мы компания Цифровые сервисы , разрабатываем новые крутые высоконагруженные информационные системы и приложения для сотрудников ОАО РЖД , а также реализуем проекты на базе исследований и изобретений Сочинского R&D центра ОЦРВ.
Ищем опытного ML- специалиста для работы над новым перспективным долгосрочным проектом Корпоративный интеллектуальный помощник (КИП) для Единой автоматизированной системы документооборота РЖД. В рамках проекта мы создаем голосового и текстового чат-бота.
Основная функция чат-бота: предоставление ответов на вопросы сотрудников по регламенту документооборота и работа в новом пользовательском интерфейсе системы документооборота. Интеллектуальным помощником ежедневно будут пользоваться 700 000 сотрудников компании ОАО РЖД . В перспективе планируется дальнейшее масштабирование проекта.
Интеллектуальный помощник разрабатывается с использованием передовых технологий на Python с применением генеративных моделей (LLM).
Стек и технологии Проекта: Python 3.11, 3.12, Rust, Golang, PostgreSQL, Qdrant, NATS, Ollama, Docker Swarm, Transformers, Hugging Face, PyTorch, Unsloth.
Стадия проекта: начальная стадия разработки.
Задачи, над которыми предстоит работать:
Помощь в создании и оптимизации пайплайнов на Python для обработки аудио и звуковых данных.
Сотрудничество с командой ML для внедрения моделей глубокого обучения, в частности трансформеров для задач, связанных с аудио.
Работа с аудиодатасетами, извлечение и обработка признаков, таких как спектрограммы и MFCC.
Участие в обучении моделей машинного обучения и их внедрении в продакшн.
Участие в исследованиях и разработке алгоритмов обработки аудио, включая распознавание речи и обнаружение звуковых событий.
Написание чистого, эффективного и масштабируемого кода на Python для поддержки рабочих процессов машинного обучения.
Изучение и внедрение лучших практик в машинном обучении в области обработки звука.
Постоянное исследование новых методов ML, особенно связанных с трансформерами и технологиями обработки аудио.
Мы ожидаем от кандидата:
Опыт разработки на Python более 5 лет (желательно в области обработки данных или разработки программного обеспечения).
Разнообразный опыт работы с asyncio, aiohttp, FastAPI.
Знание Apache Kafka (или Rabbit MQ/NATS).
Базовые знания машинного обучения и алгоритмов, желание к активному развитию и росту в этой области.
Знакомство с популярными библиотеками ML, такими как PyTorch или scikit-learn.
Желание учиться и работать с архитектурами трансформеров.
Опыт работы с Docker, Kubernetes, CI/CD.
Опыт работы с системами контроля версий, такими как Git, и понимание практик совместной разработки.
Высшее образование в области компьютерной лингвистики, математики, физики, или смежной дисциплине.
Мы предлагаем:
Работу в стабильной аккредитованной Минцифрой IT-компании, которая занимается разработкой ПО для ОАО "РЖД".
Работу в классной дружной команде единомышленников, которая поможет во всех сложностях и поддержит самые дерзкие идеи и инициативы.
Никакого легаси, драйвовая атмосфера.
Трудоустройство по ТК РФ, белую зарплату.
Достойный уровень заработной платы. Оклад, зависящий от уровня профессиональных компетенций.
Ежегодную индексацию заработной платы.
Возможность работать в форматах работы удаленный / гибрид / офис в рамках РФ.
График работы: пятидневная рабочая неделя, гибкое начало рабочего дня.
ДМС со стоматологией после испытательного срока.
Компенсацию обедов по электронным картам.
Комфортный офис в центре Москвы (2 мин. от м. Красные ворота).
Отсутствие дресс-кода.
Возможность участия в спортивных мероприятиях, организованных компанией.