Вакансия: Data scientist
Описание вакансии
НТЦ ЕЭС Информационные Комплексы современная ИТ компания, дочка АО "Системный Оператор Единой Энергетической Системы", занимающаяся разработкой специализированного программного обеспечения в сфере электроэнергетики. Мы делаем проекты полного цикла, от выявления и формализации требований, до их внедрения и запуска в продуктив.
Созданные нами программные решения помогают управлять энергосистемой страны, делая её стабильной и надёжной, а наши инновационные решения в области машинного обучения и ИИ успешно используются для прогнозирования выработки ВИЭ (солнечные и ветряные электростанции).
Наши продукты включены в Реестр российского ПО, чем мы очень гордимся :)
НТЦ ЕЭС ИК внесена в Реестр аккредитованных ИТ-компаний Минцифры России ( 11401 от 27.03.2020 г.).
Работаем в ритме Agile с применением лучших практик разработки ПО. Умеем эффективно реагировать на изменения, превращаем их в преимущество!
Сейчас у нас открыта вакансия Аналитика данных на проект ВИЭ (солнечные и ветряные электростанции).
Обязанности: - анализировать источники данных на предмет возможности их использования в решаемых задачах;
- готовить, собирать, очищать структурированные и неструктурированные исходные данные для обучения;
- создавать и проверять качество работы моделей;
- презентовать и интерпретировать работу моделей.
Требования: - опыт работы в области DS от 1 года;
- понимание алгоритмов машинного обучения и основ статистического анализа;
- умение работать с реляционными (SQL) и распределенными БД;
- владение стандартным стеком инструментов анализа данных: pandas, numpy, SciPy, matplotlib, seaborn;
- владение стандартным набором пакетов для разработки ml моделей: sklearn, catboost, xgboost, lightGBM.
Будет плюсом: - опыт построения ml сервисов (flask, fastapi, tf-serving, tensorRT);
- опыт работы с docker;
- опыт работы с airflow;
- опыт работы с MLflow;
- опыт работы с DVC;
- наличие проектов, самостоятельно доведенных до функционирования в production.
Задачи:
- Создание и сопровождение моделей предсказания генерации мощности солнечных/ветряных электростанций;
- Построение систем автоматизации мониторинга качества работы ml моделей;
- Построение систем автоматизации обработки данных от станций и построения датасетов для обучения ml моделей;
- Анализ метеоданных из разных источников;
- Поиск новых источников получения информации для повышения качества работы моделей;
- Совершенствование ml моделей предсказания мощности станций.
Стек технологий: