Резюме: Data Scientist
Опыт работы — 3 года 3 месяца
Сбер — Ведущий специалист по цифровым технологиям аудита
Ноябрь 2025 — настоящее время | 5 месяцев
Управление внутреннего аудита, отдел аудита моделей
Провожу альтернативное моделирование и валидацию ML-моделей для оценки модельного риска.
Анализирую крупные массивы данных, многомиллионные выборки, таблицы, файлы и модельную документацию.
Проверяю модели не только по качеству предсказаний, но и по устойчивости, воспроизводимости, логике принятия решений и корректности предпосылок.
Формирую гипотезы, выявляю уязвимости моделей и готовлю рекомендации по повышению надежности и интерпретируемости.
Проверяю сопроводительную документацию, пайплайны, стратегию принятия решений и аналитические процессы.
Подготавливаю данные, строю воспроизводимые ETL/ML-пайплайны, оформляю артефакты для повторной проверки в аудите.
Автоматизирую отчётность и аналитические процессы на Python и SQL.
Взаимодействую с владельцами процессов и IT-командами, помогая согласовывать бизнес-логику и техническую реализацию.
Ключевые достижения:
Разработал микросервис для автоматической генерации финализированных отчётов, что сократило ручной труд и стандартизировало оформление.
Внедрил воспроизводимые пайплайны и документацию для альтернативного моделирования, что ускорило повторную проверку и снизило риск ошибок.
АК БАРС БАНК — Риск-менеджер
Май 2025 — Октябрь 2025 | 6 месяцев
Управление валидации ML-моделей
Проводил внутреннюю валидацию моделей и методик: предсказательная способность, стабильность, согласованность, практическая применимость.
Готовил витрины данных и репрезентативные выборки для валидации.
Писал и оптимизировал SQL-запросы в PostgreSQL.
Автоматизировал процедуры валидации на Python с использованием pandas и NumPy.
Оценивал модельный риск по метрикам PSI, KS, Herfindahl Index, tolerance, IV, Gini, ROC-AUC и др.
Передавал выводы и рекомендации в процессы внутреннего контроля.
Взаимодействовал с дата-инженерами и инженерами данных.
Поддерживал рабочую среду анализа и валидации: VS Code, DBeaver, скрипты, CI-подходы.
ООО «Advantage Solutions» — Data Scientist
Январь 2024 — Апрель 2025 | 1 год 4 месяца
Multi Agent System | RAG
Работал в кросс-функциональной команде ML-инженеров, backend-разработчиков, data-инженеров и QA.
Разработал multi-agent system на базе LangChain и LangGraph для обработки клиентских запросов в реальном времени.
Интегрировал NLP-модели, Hugging Face Transformers и RAG-архитектуру, повысив точность ответов на 25% и сократив время обработки на 40%.
Спроектировал SQL Text Query Engine для перевода естественного языка в SQL с Function Calling и fine-tuned BERT, снизив нагрузку на BI-отдел на 5 часов в неделю.
Реализовал систему динамического управления бизнес-процессами на основе ClickHouse, Prophet, Statsmodels и REST API.
Оптимизировал RAG-пайплайн с FAISS и кэшированием, снизив latency на 20%.
Настроил мониторинг через Prometheus и Grafana.
ООО «МФК Фордевинд» — Data Scientist
Январь 2023 — Январь 2024 | 1 год 1 месяц
Работал над автоматизацией кредитного скоринга и управлением рисками.
Подготавливал данные: очистка пропусков, кодирование категорий, генерация временных и поведенческих признаков.
Разработал модели на CatBoost и XGBoost, оптимизировал гиперпараметры через кросс-валидацию.
Улучшил качество принятия решений по одобрению заявок на 13%.
Развернул модель в продакшн через Docker и FastAPI, настроил мониторинг в Prometheus и Grafana.
Повысил ROC-AUC на 0.07 относительно предыдущего решения.
Применил KMeans и иерархическую кластеризацию, выделив 4 группы клиентов по риску.
Совместно с BI-аналитиками предложил корректировку ставок по кластерам, что повысило ожидаемую прибыльность портфеля примерно на 5%.
Образование
Среднее образование
Повышение квалификации
2026 — АНО «Школа 21», Сбер
Machine Learning
Навыки
Языки: русский — родной, английский — C1
Технический стек: Python, SQL, PostgreSQL, ClickHouse, pandas, NumPy, scikit-learn, CatBoost, XGBoost, LightGBM, TensorFlow, PyTorch, Statsmodels, Prophet, Matplotlib, Seaborn, NLTK, Spark, Apache Airflow, FastAPI, Docker, Kubernetes, GitHub, Hugging Face Transformers, LangChain, LangGraph, RAG, Function Calling, MLflow, Prometheus, Grafana, Jupyter Notebook
Дополнительно: алгоритмы и структуры данных, теория вероятностей, Big Data, аналитическое мышление, командная работа, прогнозирование
Дополнительная информация
О себе:
Data Scientist / ML Engineer с опытом в ML-валидации, model risk, аналитике данных, RAG/LLM-системах и production-решениях. Работаю на стыке Python, SQL, статистики, машинного обучения и автоматизации процессов; умею превращать бизнес-задачи в воспроизводимые пайплайны и понятные результаты для команды и руководства.
Стек:
Python, pandas, NumPy, scikit-learn, XGBoost, CatBoost, LightGBM, TensorFlow, PyTorch, Statsmodels, Prophet, SQL, PostgreSQL, ClickHouse, Apache Airflow, Docker, FastAPI, LangChain, LangGraph, RAG, Function Calling, MLflow, Prometheus, Grafana.
Подход к работе:
Системно разбиваю задачи на этапы, быстро погружаюсь в новые домены, аккуратно работаю с деталями и понятно объясняю сложные ML- и data-процессы.
GitHub: https://github.com/HoverLife