22 марта 2026
AI / LLM Engineer
О проекте
Ищем AI / LLM Engineer в команду, которая развивает AI-продукты и внедряет большие языковые модели в production-сервисы. Основной фокус создание надёжных решений на базе LLM: от прототипирования до масштабируемых систем с контролем качества, latency и стоимости. Важно уметь превращать LLM-функциональность в стабильные продуктовые сервисы.
Задачи
Проектировать и развивать LLM-based сервисы (RAG, AI-ассистенты, генеративные фичи);
Интегрировать LLM API и open-source модели в backend-системы;
Разрабатывать RAG-пайплайны: ingestion, embeddings, retrieval, reranking;
Работать с vector DB (индексация, поиск, оптимизация);
Развивать prompt management и evaluation (качество ответов);
Оптимизировать latency и стоимость inference;
Обеспечивать надёжность и безопасность (guardrails, fallback-стратегии);
Настраивать мониторинг, логирование и поддержку сервисов;
Взаимодействовать с продуктовой и ML-командой.
Требования
Обязательно:
Коммерческий опыт разработки от 3 лет (backend / ML / AI);
Сильный Python;
Опыт работы с LLM (API или open-source модели);
Понимание RAG (retrieval, embeddings, chunking);
Опыт работы с vector DB;
Понимание prompt engineering;
Понимание trade-offs: latency / cost / quality;
Опыт промышленной разработки (Git, код-ревью, тестирование).
Будет плюсом:
Опыт с open-source LLM (LLaMA, Mistral и др.);
Fine-tuning моделей;
Опыт с NLP / ML;
Фреймворки: LangChain, LlamaIndex и др.;
Observability и evaluation инструментов (LangSmith и др.);
Docker / Kubernetes;
Облачные платформы (AWS / GCP / Azure).
Этапы:
Скрининг (30 минут);
Техническое интервью (1 час 30 минут).
Условия:
Работа в динамичной и инновационной IT-компании;
Возможности для профессионального роста в AI-направлении;
Дружный и поддерживающий коллектив;
Конкурентоспособная заработная плата;
Гибкий график и возможность удалённой работы;
Интересные задачи на стыке AI, backend и ML.
Пожалуйста, прикрепите к отклику скрининг по требованиям: отметьте плюсы напротив навыков, которыми вы владеете, и минусы напротив тех, которых у вас нет. Это поможет улучшить и ускорить рассмотрение отклика.
Например:
Коммерческий опыт разработки от 3 лет (backend / ML / AI);+
Сильный Python;+
Опыт работы с LLM (API или open-source модели);+ и тд.