Наша команда отвечает за качество моделей TTS в GigaChat той части нейросети, которая занимается звуком. Сейчас мы ищем тех, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
Задачи:
писать пайплайны обработки аудио/видео данных
подготавливать датасеты для обучения и дообучения llm
интегрироваться с ml/llm пайплайнами, бэкендом
внедрять новые решения/фреймворки/тулы в части работы с данными
улучшать надежность и масштабируемость дата процессов
инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
поддерживать хранилище данных.
Мы ждем от тебя:
python и алгоритмы на хорошем уровне, ООП (от 3 лет коммерческого опыта)
опыт с multithreading и multiprocess
опыт разработки продакшн-сервисов и дата-пайплайнов
понимание жизненного цикла LLM
понимание подходов к контролю качества данных.
S3, dvc.
Мы предлагаем:
гибридный или удаленный формат работы
ежегодный пересмотр зарплаты и годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.