Вакансия: AI-инженер (LLM / Generative AI)
Описание вакансии
aiXpert - команда российских IT-разработчиков . Основной фокус - разработка собственного кросс-платформенного superApp aiXpert с экосистемой AI и Legal Tech приложений для розницы и бизнеса. Интеграция on-premise AI решений для крупных корпоративных заказчиков.
Резидент инновационного центра "Сколково".
Аккредитованная в Минцифры РФ IT компания.
К нам в команду нужен AI-инженер.
Обязанности: - Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph .
- Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных ( Qdrant наш основной стек).
- Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде.
- Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантнности ответов.
- MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности.
- Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании.
- Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI.
Требования: - Уверенное владение Python и опыт коммерческой разработки от 3 лет.
- Практический опыт работы с фреймворками LangChain и LangGraph.
- Опыт работы с векторными базами данных, в первую очередь с Qdrant.
- Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering.
- Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio).
- Опыт файн-тюнинга (fine-tuning) open-source LLM.
- Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач.
-
Будет большим плюсом:
- Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL).
- Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM).
- Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами.
- Понимание классических алгоритмов и структур данных.
- Вклад в open-source проекты.
Условия: - Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи.
- Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально).
- Сильную команду инженеров, увлеченных своим делом.
- Гибкий график и возможность работать удаленно из любой точки мира.