Data Scientist (Северсталь Диджитал) (удаленная работа)

16 ноября 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Scientist (Северсталь Диджитал)

Мы продолжаем развивать наше ML направление в Северсталь Диджитал, наши модели управляют обжиговыми машинами, помогают производить чугун, определяют неисправное оборудование по изображению и данным с датчиков, детектируют поверхностные дефекты листа, управляют скоростью трех ключевых агрегатов на плоском прокате, в том числе с помощью Reinforcement Learning, прогнозируют рыночные цены на сталелитейную продукцию, экономят мазут и электроэнергию.

Наш технологический стек включает в себя:

  • Python 3 со стандартными DS пакетами (numpy, pandas, scikit-learn, xgboost/lightgbm;
  • Технологии Big Data (Hadoop, Hive, Spark);
  • Git, Graylog, Grafana, Kubernetes, Docker;

В твои обязанности будет входить:

  • Собирать данные из внутренних баз данных и работать с внешними источниками информации;
  • Применять анализ данных и алгоритмы машинного обучения для решения производственных задач;
  • Реализация и поддержка end-to-end продакшн решений (в команде с дата-инженером и разработчиком);
  • Тесное общение с технологами на производстве;
  • Взаимодействие с заказчиком и презентация продукта;
  • Со временем возможно менторство над 1-2 джунами;
  • Командировки на производство в г. Череповец ( не более 10%).

Тебе нужно уметь:

  • Писать понятный и воспроизводимый код;
  • Формулировать и проверять на данных статистические гипотезы;
  • Подбирать предпосылки и алгоритм машинного обучения, соответствующие поставленной бизнес-задаче, выбирать метрики и оценивать работу алгоритма;
  • Трансформировать бизнес-постановку задачи в математическую формулировку и код;

Ожидаем:

  • Опыт самостоятельной реализации DS проектов и готовность о них рассказать;
  • Опыт дизайна экспериментов и проведения пилотных испытаний;

Плюсом будет:

  • Опыт работы с промышленными данными;
  • Опыт работы с алгоритмами оптимизации (пакеты gurobi/cplex/pulp);
  • Опыт работы с семействами моделей ARIMA-GARCH;
  • Участие в ML-соревнованиях;
  • Знание Tensorflow/Pytorch.

Тебе нужно знать:

  • Python и пакеты нашего стека;
  • SQL на уровне запросов средней сложности;
  • Теорию вероятностей и математическую статистику;
  • Принципы работы алгоритмов машинного обучения (линейная регрессия, логистическая регрессия, деревья решений, случайный лес, градиентный бустинг, нейронные сети и др.);

Мы предлагаем:

  • Работу в профессиональной команде, которая готова делиться знаниями и опытом;
  • Офис на м. Войковская, МЦК Балтийская или МЦД Красный Балтиец или удаленная работа;
  • График работы 5/2 (40 часов в неделю), гибкое начало дня;
  • Официальное трудоустройство;
  • Корпоративную мобильную связь, медицинскую страховку и страхование жизни;
  • Современное рабочее пространство и уютные зоны отдыха;
  • Спортзал и велопарковку;
  • Оплату дистанционных курсов и участия в профессиональных конференциях.