Вакансия: Scoring Developer в МФО
Описание вакансии
О нас: Мы ЛигаФинансы , один из топовых финансовых холдингов России с 20-летним опытом. Наши проекты:
ЛигаЛомбард современный ломбард с инновационным подходом;
ЛигаМФО микрофинансовая компания, которая помогает людям в сложных ситуациях;
ЛигаМаркет розничный бизнес, который покоряет маркетплейсы.
Мы любим технологии, данные и людей, которые умеют их соединять. Сейчас ищем в команду Scoring Developer , чтобы вместе строить умные решения для бизнеса. Что предстоит делать: 1. Проектирование ETL-систем для гибридных данных
- Интеграция традиционных источников (кредитные истории, заявки) с альтернативными данными (социальные профили, транзакции) через Apache NiFi.
- Оптимизация feature engineering для логистической регрессии: расчет WoE, IV, обработка мульлитиколлинеарности (VIF-анализ).
2. Разработка интерпретируемых скоринговых моделей
- Построение и валидация логистических регрессий с оценкой значимости предикторов (p-values, OR-интерпретация).
- Автоматизация скоринга в реальном времени через REST API (FastAPI, Flask) с интеграцией в CRM-системы.
3. Мониторинг стабильности моделей и портфеля
- Расчет PSI (Population Stability Index) и CSI (Characteristic Stability Index) для детекции дрифта.
- Stress-testing: сценарный анализ влияния макроэкономических факторов (инфляция, безработица) на PD (вероятность дефолта).
4. Документирование
- Подготовка валидационных отчетов с акцентом на Gini-коэффициент, AUC-ROC
- Ведение Базы знаний, описывающую методологию разработки моделей
- Реализация моделей в production с аудитом логики принятия решений (white-box подход).
5. Разработка антифрод-механизмов на основе правил и ИИ
- Создание алгоритмов детекции аномалий (z-score, метод межквартильных размахов).
- Эксперименты с графовыми анализами для выявления мошеннических схем (например, выявление "кольцевых" заявок).
6. Оптимизация бизнес-метрик через A/B-тестирование
- Определение оптимального cut-off на основе матрицы классификации (precision/recall, F1-score) и unit-экономики.
- Расчет NPV кредитного портфеля с учетом LGD (Loss Given Default) и EAD (Exposure at Default).
Технологический стек:
- Основные инструменты: Python (Statsmodels, Scipy), SQL, SAS, Power BI
- Методологии: Waterfall/Agile-моделирование, версионный контроль моделей (DVC)
- Инновации: Автоматизация отчетности через Jupyter + LaTeX, эксперименты с экспертно-статистическими гибридными системами
Почему это интересно:
- Возможность улучшить логистическую регрессию так, чтобы она конкурировала с "черными ящиками" за счет feature engineering и domain knowledge.
- Работа с данными, где 80% фичей категориальные (адрес, профессия, цель займа), требующие креативного кодирования.
- Внедрение ИИ-элементов (например, NLP для анализа текстовых полей заявок) без потери интерпретируемости.
Ждем от кандидата:
- Глубокое понимание статистики: от проверки гипотез (t-test, ) до анализа мощности модели.
- Опыт оптимизации логистической регрессии: подбор коэффициентов с учетом бизнес-ограничений (например, запрет на использование возраста в скоринге).
- Способность объяснить, почему коэффициент 0.5 для признака "наличие SIM-карты" снижает риск дефолта на 12%.
Что мы предлагаем:
- Влияние на продукт: ваша модель будет определять, кому дать шанс улучшить кредитную историю.
- Работа с уникальной выборкой: микрозаймы "до зарплаты" с динамикой дефолтов 15-45%.
- Развитие в смежные области: от скоринга коллекторских стратегий до предиктивной аналитики оттока.
P.S.
Это не просто расчет коэффициентов это создание системы, где каждый параметр модели имеет экономический смысл, а ИИ-элементы дополняют, но не заменяют человеческую экспертизу. Если вы видите красоту в простоте и верите, что правильно настроенная регрессия может переиграть нейросети давайте докажем это вместе.