4 июля 2025
Кластер моделирования и исследования данных Блока Стратегия и развитие Сбера занимается разработкой AI-решений для различных бизнес-доменов подразделения: целеполагание и эффективность деятельности, управление численностью Группы, Data-driven инсайты для стратегии, анализ процессов и клиентских путей банка.
Обязанности
консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer;
end2end-разработка ML-моделей, доведение моделей из стадии MVP до целевого решения (все этапы ЖЦ моделей по CRISP-DM от Data Understanding до Deployment с использованием тех. стека банка);
NLP-задачи: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering и др.;
Domain Adaptation и дообучение (Lora SFT / SFT) большой языковой модели Сбера (GigaChat) с использованием внутренних / синтетических данных;
LLM Plugins (multi-hop reasoning, поиск, генерация fuse blocks для вызова внешних API);
разработка Python back-end сервисов для обслуживания моделей в ПРОМ-среде.
Сопутствующие обязательные стримы:
взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта;
участие в разработке архитектуры решения в части AI-компоненты (тех. стек для развертывания моделей в средах исполнения);
участие в стримах по валидации моделей и постановке их на автомониторинг
Требования
опыт в разработке NLP-моделей (обязательно) и рекомендательных систем (желательно);
высокий уровень владения ядром Python и SQL;
свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn;
опыт работы с NLP-библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp;
индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества;
Условия