13 декабря 2025
О компании:
Мы представляем компанию, занимающуюся разработкой сервиса по быстрому и качественному созданию презентационных материалов. Система работает с высокими нагрузками, ежедневно обслуживая около 20 000 пользователей.
Компания внесена в реестр аккредитованных IT-компаний
Будет плюсом, если в сопроводительном письме укажете свой Telegram .
Чем предстоит заниматься:
Разворачивать и поддерживать LLM-модели в корпоративном контуре на базе Qwen, Llama, Mistral и аналогов
Проектировать и реализовывать RAG-системы
Интегрировать LLM в основной продукт компании редактор презентаций
Выполнять дообучение LLM-моделей (LoRA или QLoRA)
Оптимизировать запросы к модели для снижения количества используемых токенов
Писать и поддерживать техническую документацию
Что мы ждём от кандидата:
Коммерческий опыт разработки на Python на уровне middle или выше
Опыт развёртывания LLM-моделей в локальном или корпоративном контуре
Опыт дообучения LLM-моделей (методами LoRA или QLoRA)
Практический опыт проектирования и внедрения RAG-систем
Уверенная работа с Git в командной разработке
Будет преимуществом:
Опыт работы с vLLM, TGI, Ollama, HuggingFace Inference
Работа с векторными базами Qdrant, Milvus, Weaviate
Опыт оптимизации производительности LLM-сервисов
Базовое понимание Docker, Linux и GPU-окружения
От компании:
Официальное трудоустройство в аккредитованную IT-компанию.
График работы 5/2 с возможностью гибкого начала и окончания рабочего дня.
Полностью официальная заработная плата без задержек, с плановым увеличением в течение 2-х лет.
Удаленный формат работы.