Data Scientist

Уровень зарплаты: от 240 000 руб.
Местоположение: Россия, Москва и область (МСК +0ч)

Резюме: Data Scientist

Опыт работы — 3 года 3 месяца
Сбер — Ведущий специалист по цифровым технологиям аудита

Ноябрь 2025 — настоящее время | 5 месяцев
Управление внутреннего аудита, отдел аудита моделей

Провожу альтернативное моделирование и валидацию ML-моделей для оценки модельного риска.

Анализирую крупные массивы данных, многомиллионные выборки, таблицы, файлы и модельную документацию.

Проверяю модели не только по качеству предсказаний, но и по устойчивости, воспроизводимости, логике принятия решений и корректности предпосылок.

Формирую гипотезы, выявляю уязвимости моделей и готовлю рекомендации по повышению надежности и интерпретируемости.

Проверяю сопроводительную документацию, пайплайны, стратегию принятия решений и аналитические процессы.

Подготавливаю данные, строю воспроизводимые ETL/ML-пайплайны, оформляю артефакты для повторной проверки в аудите.

Автоматизирую отчётность и аналитические процессы на Python и SQL.

Взаимодействую с владельцами процессов и IT-командами, помогая согласовывать бизнес-логику и техническую реализацию.

Ключевые достижения:

Разработал микросервис для автоматической генерации финализированных отчётов, что сократило ручной труд и стандартизировало оформление.

Внедрил воспроизводимые пайплайны и документацию для альтернативного моделирования, что ускорило повторную проверку и снизило риск ошибок.

АК БАРС БАНК — Риск-менеджер

Май 2025 — Октябрь 2025 | 6 месяцев
Управление валидации ML-моделей

Проводил внутреннюю валидацию моделей и методик: предсказательная способность, стабильность, согласованность, практическая применимость.

Готовил витрины данных и репрезентативные выборки для валидации.

Писал и оптимизировал SQL-запросы в PostgreSQL.

Автоматизировал процедуры валидации на Python с использованием pandas и NumPy.

Оценивал модельный риск по метрикам PSI, KS, Herfindahl Index, tolerance, IV, Gini, ROC-AUC и др.

Передавал выводы и рекомендации в процессы внутреннего контроля.

Взаимодействовал с дата-инженерами и инженерами данных.

Поддерживал рабочую среду анализа и валидации: VS Code, DBeaver, скрипты, CI-подходы.

ООО «Advantage Solutions» — Data Scientist

Январь 2024 — Апрель 2025 | 1 год 4 месяца
Multi Agent System | RAG

Работал в кросс-функциональной команде ML-инженеров, backend-разработчиков, data-инженеров и QA.

Разработал multi-agent system на базе LangChain и LangGraph для обработки клиентских запросов в реальном времени.

Интегрировал NLP-модели, Hugging Face Transformers и RAG-архитектуру, повысив точность ответов на 25% и сократив время обработки на 40%.

Спроектировал SQL Text Query Engine для перевода естественного языка в SQL с Function Calling и fine-tuned BERT, снизив нагрузку на BI-отдел на 5 часов в неделю.

Реализовал систему динамического управления бизнес-процессами на основе ClickHouse, Prophet, Statsmodels и REST API.

Оптимизировал RAG-пайплайн с FAISS и кэшированием, снизив latency на 20%.

Настроил мониторинг через Prometheus и Grafana.

ООО «МФК Фордевинд» — Data Scientist

Январь 2023 — Январь 2024 | 1 год 1 месяц

Работал над автоматизацией кредитного скоринга и управлением рисками.

Подготавливал данные: очистка пропусков, кодирование категорий, генерация временных и поведенческих признаков.

Разработал модели на CatBoost и XGBoost, оптимизировал гиперпараметры через кросс-валидацию.

Улучшил качество принятия решений по одобрению заявок на 13%.

Развернул модель в продакшн через Docker и FastAPI, настроил мониторинг в Prometheus и Grafana.

Повысил ROC-AUC на 0.07 относительно предыдущего решения.

Применил KMeans и иерархическую кластеризацию, выделив 4 группы клиентов по риску.

Совместно с BI-аналитиками предложил корректировку ставок по кластерам, что повысило ожидаемую прибыльность портфеля примерно на 5%.

Образование

Среднее образование

Повышение квалификации

2026 — АНО «Школа 21», Сбер
Machine Learning

Навыки

Языки: русский — родной, английский — C1
Технический стек: Python, SQL, PostgreSQL, ClickHouse, pandas, NumPy, scikit-learn, CatBoost, XGBoost, LightGBM, TensorFlow, PyTorch, Statsmodels, Prophet, Matplotlib, Seaborn, NLTK, Spark, Apache Airflow, FastAPI, Docker, Kubernetes, GitHub, Hugging Face Transformers, LangChain, LangGraph, RAG, Function Calling, MLflow, Prometheus, Grafana, Jupyter Notebook
Дополнительно: алгоритмы и структуры данных, теория вероятностей, Big Data, аналитическое мышление, командная работа, прогнозирование

Дополнительная информация

О себе:
Data Scientist / ML Engineer с опытом в ML-валидации, model risk, аналитике данных, RAG/LLM-системах и production-решениях. Работаю на стыке Python, SQL, статистики, машинного обучения и автоматизации процессов; умею превращать бизнес-задачи в воспроизводимые пайплайны и понятные результаты для команды и руководства.

Стек:
Python, pandas, NumPy, scikit-learn, XGBoost, CatBoost, LightGBM, TensorFlow, PyTorch, Statsmodels, Prophet, SQL, PostgreSQL, ClickHouse, Apache Airflow, Docker, FastAPI, LangChain, LangGraph, RAG, Function Calling, MLflow, Prometheus, Grafana.

Подход к работе:
Системно разбиваю задачи на этапы, быстро погружаюсь в новые домены, аккуратно работаю с деталями и понятно объясняю сложные ML- и data-процессы.

GitHub: https://github.com/HoverLife

Посмотрите похожие резюме

Бизнес-архитектор
Зарплата: 3 000 руб.
Разработчик подборок
Зарплата: 3 000 руб.
Менеджер ИТ-проектов
Зарплата: 3 000 руб.