26 ноября 2025
ОДИН ИЗ ЛУЧШИХ РАБОТОДАТЕЛЕЙ РОССИИ
Мы Neoflex. Аккредитованная IT компания. За 20 лет работы мы создали 12+ готовых решений для бизнеса, так же занимаемся заказной разработкой программного обеспечения.
Приветствуем на странице нашей компании и благодарим за интерес к вакансии. Будем рады оказаться полезны друг другу.
Мы ищем ведущего инженера, который станет одним из технических лидеров нашей LLM-команды, будет формировать архитектурные решения, выбирать стэк, задавать стандарты разработки и подходы к оценке качества, помогать команде выводить сложные AI-системы в продакшн и развивать их.
Стек проекта: Python, PyTorch, Transformers, LangChain/LangGraph, Milvus/Weaviate/FAISS/etc, ONNX/Triton/TensorRT/vLLM, LangFuse, FastAPI/Flask/Django, REST/gRPC, Airflow/Dagster, Docker, Kubernetes, GitLab CI, SQL.
Чем предстоит заниматься:
проектированием, разработкой и внедрением решений на основе LLM для различных бизнес-задач (от простых knowledge ботов, до платформ оркестрации агентов);
взаимодействовать с командами разработки, domain-экспертами и аналитиками;
обеспечивать качество и надёжность систем: дизайн метрик, создание бенчмарков и regression-тестов, A/B-тесты, мониторинг, guardrails и observability;
оптимизировать производительность и стоимости инференса;
курировать R&D-прототипы, участвовать в митапах и хакатонах (по желанию), заниматься менторством коллег и развитие экспертизы команды.
Что мы ждём от вас (must-have):
2+ лет коммерческого опыта в AI/ML-инженерии/ backend-разработке, из них 1+ лет в NLP/LLM или GenAI-проектах;
уверенное владение Python, SQL и Git с глубоким понимание принципов разработки ПО;
опыт разработки и поддержки REST-сервисов (FastAPI, Flask, Django);
опыт внедрения в промышленную эксплуатацию решений на базе LLM;
опыт построения надежных систем оценки качества AI-решений: от подготовки данных до автоматизированных проверок и A/B-экспериментов;
умение работать с облаками (Yandex Cloud и т.п.) и инфраструктурой для развертывания сервисов (Docker, Kubernetes).
Будет плюсом:
опыт построения AI-платформ, фреймворков или SDK;
навыки обучения с нуля, дообучения, оптимизации или кастомизации инференса LLM-моделей;
опыт работы с мультимодальными и речевыми моделями (VLM, ASR, TTS);
вклад в open-source, публикации (Q1), выступления на конференциях (A/A+);
объяснять сложные вещи простым языком для нетехнических стейкхолдеров.
Что ты приобретёшь, присоединившись к нам:
страховка ДМС (с 3-го месяца работы, стоматология, возможность подключения родственников, теле медицина, полис ВЗР),
Больничный Без Больничного 4 дня в году,
сотрудникам со стажем в Neoflex более 3 месяцев при предоставлении листка нетрудоспособности устанавливается доплата до полного заработка за период болезни,
обучение детей сотрудников ИТ специальностям,
компенсация затрат на фитнес и занятия английским языком;
Здесь мечты превращаются в реальность. Мы будем рады, если ты станешь частью нашей команды! Откликайся ;)