Наша команда занимается задачами синтеза речи. Мы разрабатываем платформу распознавания и синтеза речи для виртуальных ассистентов, обработки голосовых сообщений, автоматизации работы колл-центра.
Сейчас ищем Senior/Middle ML разработчика, который будет заниматься улучшением качества синтеза и сможет внедрить самые современные подходы и идеи.
Вам предстоит:
заниматься разработкой DL-моделей для синтеза речи, исследовать подходы по улучшению интонации голоса, добавлению эмоций, управлению стилем речи;
читать статьи, понимать что в них происходит, уметь их заимплементировать и рассказать в чем смысл подхода;
выводить в продакшн топовые модели, оптимизировать инференс и улучшать производительность пайплайна;
работать с продуктовой, бэкенд и клиентскими командами для улучшения продукта.
Что мы ждем:
опыт работы со звуком/желание хорошо разобраться в аудио домене;
знание современного ML/DL стека: python3, numpy, pytorch, keras/tf, librosa/torchaudio, pandas, git, unix;
опыт обучения DL моделей, логирования экспериментов;
умение писать чистый, понятный, корректный код;
опыт работы с моделями в продакшене, опыт оптимизации DL моделей;
опыт написания и поддержки продакшн кода на python;
опыт использования docker, CI/CD;
плюсом будет оптимизация для работы на конечных устройствах и опыт работы с tflite, onnx, onnxruntime, netron.
Что мы предлагаем: