Data Engineer (проект на 6 месяцев) (удаленная работа)
(вакансия не опубликована)

2 декабря 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Engineer (проект на 6 месяцев)

Описание вакансии

Мы - крупнейший ритейлер в офлайне и онлайне в РФ, ищем эксперта с высокой ролью ответственности на проекте, умеющего самостоятельно и в команде принимать решение по архитектуре и реализации.


Нашему будущему коллеге предстоит работать над проектом: OMNI-дашборды - системой визуализации отчетности для покрытия потребности в аналитических инструментах для высшего и среднего менеджмента Компании. Работать над развитием Корпоративного Хранилища Данных (Hadoop), которое является основным источником данных для этого проекта.

Цель проекта реализовать уникальную систему по работе с клиентскими данными ПАО "Детский мир" на основе используемых компонентов и стэка технологий и программного обеспечения компании. По итогам проекта в компании появится единый источник непротиворечивой и консистентной информации для принятия управленческих решений.

Что нужно делать?

  • Создавать Spark ETL pipeline для загрузки данных в HDFS и преобразования данных на HDFS

  • Обсуждать с аналитиками алгоритмы преобразования данных, переводить SQL от аналитиков в Spark API

  • Участвовать в code review

  • Проектировать и создавать архитектуру проекта и адаптировать ее под новые требования

  • Понимать процессы CI/CD, мониторинга, взаимодействовать с командой DevOps

  • Проектировать, разрабатывать и поддерживать витрины данных

    • обычно это Sql или DataFrame API

  • Разрабатывать алгоритмы выгрузки, обработки, хранения данных (ETL) из разных систем, интеграция с внешними системами:

    • sql

    • но бывает csv, xml, json, API

  • Разрабатывать правила и процедуры контроля качества данных

  • Поддерживать переливки витрин в ClickHouse

  • Создавать Дашборды в SuperSet

  • Поддерживать цепочки поставки витрин

Наш стек:

  • Apache Spark и Apache Airflow

  • Hadoop 3

  • ClickHouse

  • SuperSet

  • Docker, Kubernetes, VictoriaMetrics

  • GitLab для CI/CD

Наши ожидания:

  • Знания SQL

  • Понимание жизненного цикла разработки ПО, культуры CI/CD

  • Опыт создания и оптимизации Spark batch jobs, Scala API, PySpark

  • Опыт работы с Airflow, умение создавать DAG'и, состоящие из Task и Sensor

  • Будет плюсом:

  • Опыт работы с Kubernetes, Helm

  • Опыт работы с GitLab CI/CD

Будет плюсом:

  • Опыт работы с GitLab CI/CD

Мы предлагаем:

  • Официальное трудоустройство по ТК РФ: мы заключим с вами срочный трудовой договор на 6 месяцев

  • Оформление в аккредитованную ИТ компанию
  • Комфортный современный офис в районе мцк/мжд/метро Окружная (пешая доступность) или метро Петровско-Разумовская (10 минут на транспорте)
  • График работы: 5/2, гибкое начало рабочего времени, работа в офисе, гибридный график (частично-удаленный формат работы) или удаленный формат на выбор
  • Хорошая техническая оснащенность: Современный макбук


Посмотрите похожие вакансии

SAP BW/4HANA Data Engineer (HR направление) Middle+/Senior
Компания: ГК Орбита
Зарплата: з.п. не указана
Lead Data Engineer
Компания: Employcity
Зарплата: з.п. не указана
PostgreSQL DBA / Database Engineer
Компания: ГК Орбита
Зарплата: з.п. не указана
Lead BackEnd Software Engineer
Компания: EFIX GROUP
Зарплата: от 389 778 до 467 734 руб.