Задание: Машинное обучение. LLM Engineer (middle/senior) (Дистанционная работа)
Компания АО Мастерская
Мы создаём “Майю” — персонального AI-ассистента для руководителей, который:
узнает владельца по голосу
автоматически протоколирует встречи
формирует контекстные саммари, пишет письма, инициирует follow-ups
хранит знание в векторной базе и мгновенно отвечает на вопросы через RAG-пайплайн
Наша цель — вернуть человеку время и фокус
Основные обязанности:
Развивать голосовой стек
доработка Wake-word, webrtcvad, адаптивное шумоподавление (DeepFilterNet);
оптимизация диаризации (PyAnnote) и ASR (Whisper / Whisper-large-v3).
LLM /RAG-пайплайн
экспериментировать с открытыми LLM + LoRA для пост-процессинга транскриптов и поисковых чанк-ответов;
строить цепочки в Llama-Index, настраивать роутинг запросов и постоянное обновление Qdrant.
Fine-Tuning & Evaluation
улучшать модели под задачи summarization, dialogue-rewrite;
разрабатывать метрики: WER, ROUGE, Recall@k, latency < 500 мс.
Требования к кандидату:
2+ года коммерческой разработки ПО, 1+ год — в AI-проектах.
Уверенный Python 3 + PyTorch, asyncio, aiohttp / FastAPI.
Повседневный Docker, опыт DevOps; работа с RabbitMQ или Kafka
Отличное знание PostgreSQL
Умение планировать задачи и оценивать сроки.
Опыт ASR/TTS (Whisper, Silero-TTS), VAD, аудио-DSP.
Навыки PEFT/LoRA, quantization, оптимизации LLM на ограниченном железе.
Понимание архитектуры Apple Silicon (Metal, ANE) и on-device ML-ограничений.
Будет плюсом
Практика с LLM-сервисами (GigaChat, GPT-4, Claude и др.) и понимание их ограничений.
Работа с векторными БД (Elasticsearch, Qdrant, Weaviate).
Знание LangChain, Llama-Index, DSPy и других AI-фреймворков.
Опыт prompt-инжиниринга
Опыт работы от 2 лет
Условия работы:
Формат: Remote-first
Доход: Почасовая ставка в рамках проекта, оплата ежемесячно (от 1200 до 2500 рублей в час)
Оформление: ИП или самозанятый (обсуждаемо)
Перки: оплаченный курсор, Gemini, OpenAI
Частичная занятость
Место работы
Удаленная работа
Контакты:
Telegram: reyingand