5 декабря 2025
проектировать и создавать ядра AI-платформы (разработка и оптимизация пайплайнов, где LLM (OpenAI, Mistral, Claude, OSS) взаимодействуют в сложных мульти-агентных системах (AutoGen, LangGraph), самостоятельно принимая решения, построения интеллектуальной системы доступа к знаниям (RAG), используя передовые векторные (Qdrant, FAISS) и графовые БД, создание модульной архитектуры, где агенты смогут динамически подключаться к любым API и внутренним системам, общаясь друг с другом,
внедрять оптимизацию и инновации в LLM-стэке (экспериментировать с гибридными сценариями (облако + локальные модели), чтобы найти идеальный баланс между стоимостью, скоростью и качеством, используя такие инструменты как vLLM и TensorRT-LLM, внедрять механизмы тонкой настройки (LoRA, QLoRA) и непрерывного обучения, чтобы наши агенты становились только умнее);
управлять полным циклом R&D (от пилотного эксперимента с нейросимволическим подходом до внедрения системы continuous learning в продакшн держать руку на пульсе самых свежих технологий и решать, какие из них дадут нам реальное преимущество.
понимаете архитектуру трансформеров и современные NLP-подходы, можете объяснить разницу не только на словах, но и в коде;
имеете опыт работы с Python это не просто скрипты, а отлаженные системы на FastAPI, с глубоким пониманием LangChain/LlamaIndex и умением строить ML-пайплайны на Apache Ray;
имеете практический опыт во всем цикле жизни LLM: от prompt engineering и chain-of-thought до дообучения, оптимизации инференса и развертывания в продакшн (Kubernetes, Docker, CI/CD);
знаете, как построить ETL для синтетических данных и как заставить агентов эффективно работать вместе, координируя их через LLM-оркестраторы.