22 ноября 2024
Компания KVINT ведущая компания по разработке и внедрению голосовых роботов/виртуальных ассистентов.
Основной продукт голосовые виртуальные ассистенты, способные заменить живого человека на телефоне на входящих и исходящих звонках, во время которых роботы полностью имитируют живое человеческое общение по телефону, и люди не догадываются, что общаются с роботом.
Решение построено на нейронных моделях, содержит технологии синтеза и распознавания речи, обработки естественного языка и управления диалогом.
Мы ищем человека, который хочет принимать участие в создании крупного и интересного проекта, обладает высокой квалификацией и готов работать в команде. Если вы уверены в своих способностях и ищете новые вызовы, мы будем рады видеть вас в нашей команде!
Основные задачи:
Разработка и оптимизация моделей LLM для голосовых ассистентов, включая fine-tuning opensource LLM для обработки звонков на русском языке, с адаптацией моделей под специфические особенности телефонного домена.
Подбор и дообучение моделей LLM для оптимального использования ресурсов, улучшения производительности и точности инференса.
Проведение стресс-тестирования моделей для гарантии надежности и производительности в высоконагруженной среде.
Разработка и интеграция решений по созданию и обновлению базы знаний на основе документов различных типов, с прицелом на телефонные сценарии.
Требования:
Уверенные знания Python (Data Science), PyTorch, Docker
Опыт работы с LLM (prompt engineering, fine-tuning)
Глубокое понимание DL и NLP для работы с текстовыми данными
Опыт работы с векторными базами данных
Желателен опыт в дистилляции и прунинге нейронных сетей
Желателен опыт работы с Nvidia Triton Server
Условия: