Вакансия: Data/ML Engineer
Компания "Ростелеком"
ПАО «Ростелеком» (www.company.rt.ru) – крупнейший в России провайдер цифровых услуг и решений, присутствующий во всех сегментах рынка и охватывающий миллионы домохозяйств в России.
Компания занимает лидирующее положение на российском рынке услуг широкополосного доступа в Интернет и интерактивного телевидения.
На массовом рынке компания развивает широкую линейку сервисов для семьи, включая базовые услуги связи и цифровые решения для «Умного дома», онлайн-образования, геймеров и др.
Компания – признанный технологический лидер в инновационных решениях в области электронного правительства, кибербезопасности, облачных вычислений, здравоохранения, образования, безопасности, жилищно-коммунальных услуг.
Обязанности:
- Развитие цикла процесса разработки и расчета ML моделей:
- На входе витрины в хранилище данных
- Реализация конструктора и хранилища признаков для моделей
- Автоматизация процесса подготовки витрин для моделей с учетом конструктора признаков;
- Реализация проверок качества данных
- Внедрение системы управления моделями
- Автоматизация обучения и тестирования моделей
- Разработка API для внешних сервисов
- Реализация инструментов мониторинга качества моделей
- Настройка новых библиотек и инструментов для data scientist
- Помощь data scientist в оптимизации запросов/заданий на Hadoop (Hive, Spark).
Технологии:
- Кластер Hadoop
- Python, Scala
- Реляционные базы данных (GreenPlum, Oracle)
- Airflow
- MLFlow
- Kubernetes
Требования (обязательно):
- Уровень middle, senior;
- Знание Hadoop (Hive, Sqoop, Spark: SparkML, SparkSQL, SparkStreaming)
- Знание Airflow, MLFlow, Kubernetes
- Продвинутый уровень SQL (умение писать сложные запросы)
- Хороший уровень Python (в т.ч. PySpark), Scala
- Знание Bash, linux
Желательно:
- Знание библиотек машинного обучения и статистического анализа
- Знание алгоритмов машинного обучения
Бизнес задачи, которые перед нами стоят:
- Разработка предиктивных моделей оттока и снижения лояльности клиентов.
- Разработка рекомендательных моделей по продажам.
- Разработка поведенческой сегментации клиентов.
- Расчет эластичности оттока и дохода от клиента по характеристикам продукта и сервису.
- Интеллектуальная автоматизация процессов компании.
- Разработка цифровых двойников процессов компании и их интеллектуальная оптимизация.
- Разработка экспериментов для A/B-тестирования гипотез бизнеса.
Условия:
- Удобный офис с кухней, фруктами, кофе;
- ДМС со стоматологией
- лояльный офисный график, возможность частичной удаленной работы (после пандемии планируем работать по схеме неделя офис / неделя удаленно);
- оформление по ТК;
- квартальные и годовые бонусы;
- возможности для развития: внутреннее и внешнее, доступ к корпоративным библиотекам технической и бизнес литературы, посещение профильных конференций и курсов за счет компании.