14 марта 2026
Мы в hh создаем продукты и AI-ассистентов для работодателей и соискателей на базе генеративных технологий. Уже сейчас мы используем LLM-модели для генерации текстов, ведения диалогов, классификации и анализа вакансий и резюме. Направление активно развивается, и сейчас мы ищем талантливого Python инженера, который поможет нам в выстроить в компании эффективную систему оценки качества GenAI фичей.
Если вам интересно закладывать основу для устойчивого использования GenAI в продуктах через бенчмарки, метрики и процессы, которым будут следовать десятки команд, и вы смотрите на ML не просто как на модели, а как на инструмент влияния на продукт мы будем рады видеть вас в нашей команде.
Разрабатывать высокопроизводительный сервис для массового тестирования GenAI решений - от простых запросов к LLM до сложных агентов с отдельным окружением;
Развивать архитектуру сервиса тестирования и строить дальнейшие планы по его развитию в соответствии с реальными нуждами внутренних пользователей;
Разобраться с подходом Evaluation-Driven-Development для разработки GenAI фичей и заложить его в архитектуру и дизайн сервиса для тестирования;
Интегрировать сервис с платформой трейсинга LangFuse;
Помогать разрабатывать внутренние бенчмарки по hr домену для оценки open source LLM моделей и добавлять их в сервис тестирования;
Помогать разрабатывать диалогового агента для тестирования чат-ботов;
Разрабатывать и поддерживать лучшие практики, кукбуки, инструкции и другие материалы, которые помогут командам ускорить и упростить процесс разработки и тестирования GenAI с помощью сервиса тестирования;
Активно взаимодействовать с продуктовыми командами, помогать внедрять инструменты и подходы к оценке качества GenAi решений.
Уверенное знание python3 (asyncio, mutiprocessing/multithreading, организация кода, работа с менеджерами зависимостями), понимание как это работает внутри;
Умение проектировать и развивать архитектуру сервисов;
Опыт работы с базами, очередями;
Опыт работы с fastapi;
Опыт работы с API вызовами LLM провайдеров openai/google и тд, знание особенностей и различий;
Опыт работы с современными инструментами для разработки, основанными на LLM (Cursor, Claude Code, Codex и тд), понимание их сильных и слабых сторон.
Знание Java;
Опыт работы с bash, k8s, nfs;
Опыт работы с различными хранилищами - clickhouse, hdfs, s3;
Опыт работы с векторными базами данных (Milvus/Qdrant/FAISS/pgvector) для RAG решений и не только;
Опыт работы с трейсинг платформами, основанными на OpenTelemetry;
Опыт сборки, выкатки, мониторинга, траблшутинга сервисов;
Знание LLM фреймворков (langchain, langgraph или аналоги) и подходов к разработке AI-агентов (function calling, structured output, context engineering);
Опыт работы с инференсом open-source LLM-моделей (vLLM/SGLang).