Вакансия: Разработчик ML
Описание вакансии
Иннотех современная быстроразвивающаяся аккредитованная IT-компания с фокусом на высокие технологии. Мы выросли до 10 000+ человек менее чем за два года. Вместе мы создаем финтех, который будет доступен каждому: развиваем Цифровую банковскую платформу , выстраиваем партнерские отношения с топовыми финансовыми компаниями, создаем комплексные решения для фронт- и бэк-офисов, строим системы работы с большими данными.
В Иннотех стабильность работы финансовая надежность, социальные гарантии, бонусы и бенефиты, сочетается с преимуществами IT-компании открытость, инновации, гибридный формат работы.
Мы стремительно растем, масштабируемся и ищем новых специалистов в команду!
О проекте: Департамент анализа данных и моделирования создан в 2019 году для стратегического развития функции анализа данных в ВТБ. Управление процессных и Финансовых моделей специализируется на разработке моделей для управления активами и пассивами Банка, структурой баланса, управления процентным риском, риском ликвидности и достаточностью капитала.
Задачи, которые предстоит решать:
- Разработка кода для применения ML-решений в промышленной среде
- Работа с базами данных и корпоративными хранилищами данных
- Участие в проектировании архитектурных решений, процессах определения ресурсов, оценки трудозатрат, рисков ML-проектов
- Участие в code review, написание Unit-тестов
Какие знания и навыки для нас важны:
- Хорошие знания и опыт практического применения теории вероятностей и математической статистики
- Знание основных алгоритмов и методов машинного обучение и анализа данных: линейные модели, ансамблевые методы, анализ и прогнозирование временных рядов
- Опыт разработки моделей на языке Python
- Знание основного инструментария стэка Python: Jupyter, Pandas, Scikit-learn, Statsmodels
- Опыт работы с кластером Hadoop и в разработке приложений BIG DATA
- Опыт работы с корпоративными хранилищами данных и понимание принципов их построения
- Понимание методик unit-тестирования
- Умение разбираться в чужом коде
Будет преимуществом:
- Опыт работы с экосистемой Apache Hadoop (HDFS, Impala, Hive, Hue)
- Опыт работы с фреймворком Apache Spark (Pyspark, MLlib, Spark SQL)
- Понимание принципов CI/CD
- Опыт работы с СУБД класса NoSQL (ClickHouse, HBase)