25 марта 2026
Data Scientist (RAG Systems) Middle+ / Senior
Направление: LLM / NLP / Information Retrieval
Формат: удалёнка
ЗП: $4000
Технологический стек: Python
Чем предстоит заниматься
Проектировать и улучшать многоступенчатые RAG-пайплайны: retriever reranker generator
Экспериментировать с чанкингом, эмбеддингами и векторными БД (Weaviate, Qdrant, FAISS) включая гибридный поиск (BM25 + vector)
Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG
Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)
Оценивать качество системы: Recall@K, MRR, NDCG, faithfulness, answer relevance, citation accuracy, A/B-тесты
Работать с LLM: промпт-инжиниринг, извлечение структурированной информации из документов; при необходимости fine-tuning / LoRA
Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу
Строить data pipelines для инжеста, парсинга и обогащения корпуса документов
Мы ожидаем
3+ года практического опыта в NLP/IR и портфолио с RAG/LLM-проектами
Уверенное владение Python
Глубокое понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы
Опыт с векторными индексами и настройкой поиска (HNSW, IVF, фильтрация по метаданным)
Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)
Чтобы мы рассмотрели ваш отклик пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.