Middle ML Developer (Voice, ASR, STT/TTS) (удаленная работа)

Sifox

18 июня 2026

Если информация в вакансии не соответствует действительности, или эта вакансия является мошенничеством, сообщите, пожалуйста, модератору, используя кнопку . Спасибо.

Уровень зарплаты:
з.п. не указана

Требуемый опыт работы:
Не указан

Вакансия: Middle ML Developer (Voice, ASR, STT/TTS)

Описание вакансии

Наша компания специализируется на разработке голосовых сервисов для телеком-индустрии. Мы внедряем наши продукты в сети крупных операторов мобильной связи, активно растем и, в связи с этим, усиливаем команду. Резидент Сколково .

Локация: удаленно (с возможностью посещения офиса, Москва, м.Динамо)

Ищем Middle ML разработчика , который будет отвечать за разработку и масштабирование приложения для анализа и синтеза речи в режиме реального времени, также интеграции данного приложения в имеющуюся голосовую платформу.

Задачи

Реализация стримингового движка ASR для виртуального ассистента на основе open source библиотек
Участие в доработке файлового speech-to-text движка совместно с data science командой
Проектирование и улучшение компонент ASR, включая шумоподавление, акустическую и лингвистическую модели
Создание и улучшение модулей синтеза речи для диалоговых роботов
Обучение моделей ASR/TTS как для русского языка, так и для low source языков
Интеграция и масштабирование разработанных модулей в продукты компании
Доработка сторонних библиотек и при необходимости переписывание критичных к производительности компонент с python на другие языки
Оптимизация моделей и алгоритмов для обработки аудио под высокие нагрузки
Написание тестов и проведение нагрузочного тестирования
Взаимодействие с продуктовой командой, аналитиками и разработчиками платформы

Требования

Опыт в разработке голосовых приложений от 2х лет
Глубокие знания Python
Умение писать читаемый и тестируемый код с высокой степенью масштабируемости
Опыт продуктивизации голосовых ML моделей в высоконагруженных средах
Глубокое знание современного ML стека (pytorch, onnx, pytest, openvino, Triton Inference Server и др.)
Знание библиотек для работы с аудио, например: librosa, torchaudio и др.
Хорошее представление об известных ASR библиотеках: kaldi, nvidia nemo, espnet и др.
Понимание теории обработки речи и физики звука, умение работать со спектрограммами

Приветствуется

Знание различных языков программирования cython, С++, Erlang, SQL
Знакомство с инструментами: RabbitMQ, PostgreSQL, FreeSwitch
Опыт в телеком-проектах

Условия:

З/п - фикс + бонусы (уровень дохода обсуждается с финальным кандидатом)
Гибкий график (начало рабочего дня может обсуждаться с руководителем) при занятости full-time (40 ч/нед)
Формат работы: удаленный, с возможностью посещения офиса (при желании)
Оформление с соблюдением всех норм ТК РФ
ДМС (после 3 мес. испытательного периода)

Откликнуться на вакансию

Количество просмотров: 62

Добавить в закладки

Подтвердите действие

Список регионов

Middle ML Developer (Voice, ASR, STT/TTS) (удаленная работа)

Sifox

Вакансия: Middle ML Developer (Voice, ASR, STT/TTS)

Описание вакансии