14 февраля 2026
ОДИН ИЗ ЛУЧШИХ РАБОТОДАТЕЛЕЙ РОССИИ
Мы Neoflex. Аккредитованная IT компания. За 20 лет работы мы создали 12+ готовых решений для бизнеса, так же занимаемся заказной разработкой программного обеспечения.
Приветствуем на странице нашей компании и благодарим за интерес к вакансии. Будем рады оказаться полезны друг другу.
Мы развиваем направление LLM/GenAI и ищем инженера, который станет техническим лидером для нескольких продуктовых команд: поможет проектировать LLM системы (включая агентные workflow), выстроит подходы к оценке качества и надёжности, и будет помогать командам стабильно доводить решения до промышленной эксплуатации.
Если вы не совпадаете со всеми пунктами, но вам близки сложные агентные workflow и вы понимаете, как выстраивать валидацию и observability откликайтесь.
Стек проекта: Python, PyTorch, LangChain/LangGraph, Milvus/Weaviate/etc, Triton/vLLM, LangFuse, LiteLLM, FastAPI, GitLab CI, SQL.
Чем предстоит заниматься:
Помогать командам с архитектурой и системным дизайном: reference подходы, дизайн ревью, стандарты, best practices для нескольких продуктовых команд.
Проектировать и улучшать агентные решения: выбирать паттерны (router, planner/executor, ReAct и т.п.), проектировать tool use, structured output, orchestration (workflow/graph/state machine), безопасные контуры выполнения.
Выстраивать качество и надёжность: метрики, бенчмарки и regression проверки, A/B эксперименты, мониторинг, guardrails, observability (трейсинг/логирование/алерты).
Оптимизировать производительность и стоимость инференса (latency/cost), помогать командам с production готовностью (SLA, стабильность, масштабирование).
Курировать R&D прототипы и доводить их до продукта; менторить коллег, развивать инженерную экспертизу (митапы/хакатоны по желанию).
Что мы ждём от вас (must-have):
3+ лет коммерческого опыта в software engineering / backend / AI/ML инженерии, из них 2+ года в LLM/GenAI проектах (в проде).
Уверенное владение Python, SQL, Git и хорошее понимание инженерных практик разработки (архитектура сервисов, тестирование, CI/CD, эксплуатация).
Опыт внедрения и поддержки в промышленной эксплуатации решений на базе LLM (включая мониторинг/инциденты/качество/стоимость).
Опыт построения систем оценки качества LLM/agent решений: метрики, датасеты/бенчмарки, автоматизированные проверки, A/B эксперименты, интерпретация результатов.
Опыт технического лидерства: дизайн/архитектурные решения, координация с командами, взаимодействие с заказчиками, защита/аргументация технических решений.
Будет плюсом:
Опыт построения AI платформ, фреймворков, SDK или внутренних библиотек/компонентов для команд.
Опыт оптимизации и/или кастомизации инференса (vLLM/Triton/квантизация/батчинг/кэширование).
Опыт fine tuning / PEFT (LoRA/QLoRA) или дообучения эмбеддеров/реранкеров.
Опыт работы с мультимодальными и речевыми моделями (VLM, ASR, TTS).
Вклад в open source, публикации/выступления на конференциях.
Умение объяснять сложные вещи простым языком и переводить требования бизнеса в технические метрики качества.
Что ты приобретёшь, присоединившись к нам:
страховка ДМС (с 3-го месяца работы, стоматология, возможность подключения родственников, теле медицина, полис ВЗР),
сотрудникам со стажем в Neoflex более 3 месяцев при предоставлении листка нетрудоспособности устанавливается доплата до полного заработка за период болезни,
обучение детей сотрудников ИТ специальностям,
компенсация затрат на фитнес и занятия английским языком;
Здесь мечты превращаются в реальность. Мы будем рады, если ты станешь частью нашей команды! Откликайся ;)