Data Engineer Senior (удаленная работа)

26 мая 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Engineer Senior

Описание вакансии

Вам предстоит:

Data Warehouse:

  • Проектирование и построение DWH в ClickHouse с нуля: схемы, партиционирование, TTL, материализованные представления;
  • Подключение всех источников данных компании: CRM, сайт, колл-трекинг, 1С, СОД, ERP 100% покрытие к концу Фазы 1;
  • Стандартизация форматов данных между разными системами единая модель для аналитики и ML;
  • Управление версионированием схем базы данных, миграции без потери данных;
  • Оптимизация запросов: индексы, первичные ключи, профилирование медленных запросов.

ETL-пайплайны:

  • Разработка и поддержка ETL-пайплайнов на Python (pandas, polars) для всех 12 бизнес-блоков;
  • Оркестрация пайплайнов через Apache Airflow: расписания, зависимости, алерты при падениях;
  • Обработка ошибок, идемпотентность загрузок данные не должны дублироваться или теряться;
  • Инкрементальная загрузка: только изменившиеся данные, без полной перезаписи;
  • Мониторинг свежести данных: алерт если данные не обновлялись дольше порога.

Парсинг и внешние источники:

  • Мониторинг новых ПД в строительной отрасли;
  • Сбор цен на строительные материалы с сайтов поставщиков для Департамента закупок;
  • Playwright / Scrapy для сайтов с динамическим рендерингом (SPA, JavaScript-сайты);
  • Работа с API: HH.ru, Битрикс24, Telegram Bot API, Perplexity подключение новых источников по запросу.

Интеграции:

  • REST API интеграции с корпоративными системами: CRM, ERP, HR-система, СОД;
  • Webhooks приём событий в реальном времени из внешних систем;
  • Разработка и документирование внутренних API для доступа к данным DWH;
  • Управление доступами к данным совместно с MLOps: RBAC на уровне таблиц и схем.

Качество данных:

  • Настройка валидации данных на входе: типы, диапазоны, обязательные поля;
  • Мониторинг аномалий в данных: выбросы, пропуски, несоответствия между источниками;
  • Документирование источников, форматов и логики трансформаций (data lineage);
  • Сверка данных между системами: BI vs БДР расхождения должны стремиться к нулю.

Документация и процессы:

  • Документирование всех пайплайнов: источник трансформация назначение;
  • Runbook'и для команды: как добавить новый источник, как откатить миграцию, что делать при инциденте;
  • Участие в техническом планировании совместно с ML Engineer: какие данные нужны для модели и в каком формате.
Наши ожидания:
  • ClickHouse продакшн опыт: проектирование схем, оптимизация запросов, партиционирование;
  • Python ETL pandas, polars: трансформации, очистка, дедупликация данных;
  • Apache Airflow реальный опыт в проде: DAG'и, операторы, мониторинг задач;
  • SQL продвинутый оконные функции, CTE, аналитические запросы, оптимизация;
  • REST API интеграции подключение внешних систем, обработка авторизации (OAuth2, API Key);
  • Scrapy / Playwright парсинг сайтов, в том числе с динамическим рендерингом;
  • Понимание моделей данных: звезда, снежинка, Data Vault когда что применять;
  • Linux администрирование, cron, работа с файловой системой и сетью;
  • Понимание моделей данных: когда нужна нормализация, когда денормализация под аналитику;
  • Понимание 152-ФЗ какие данные являются ПДн, что нельзя передавать во внешние сервисы;
  • Скорость: ad-hoc аналитический запрос + вывод за 2 4 часа критично для бизнес-блоков.

Дополнительно:

  • Kafka / RabbitMQ потоковая обработка событий в реальном времени;
  • dbt трансформации данных внутри DWH, тестирование моделей;
  • PostgreSQL опыт как дополнение к ClickHouse для транзакционных данных;
  • Docker контейнеризация пайплайнов для деплоя через MLOps;
  • Yandex Cloud Object Storage, Managed ClickHouse, DataLens.

В Dogma Вас ждут:

  • Работа в крупном строительном холдинге федерального уровня;
  • Официальное оформление по ТК РФ с первого рабочего дня (стабильная белая заработная плата с выплатами 2 раза в месяц, оплата больничных листов, ежегодные отпуска);
  • График работы 5/2 с 09.00 до 18.00;
  • Корпоративная программа лояльности для сотрудников Best Benefits скидки от партнёров;
  • Скидки для сотрудников на приобретение недвижимости компании от 4% до 7%;
  • Всё для эффективной и качественной работы: профессиональная техника, мобильный телефон и корпоративная сотовая связь;
  • Возможность обучения и развития в рамках корпоративного университета компании (тренинги, мастер-классы, онлайн-обучение);
  • Корпоративные подарки детям сотрудников к Новому году и объединяющие корпоративные мероприятия;
  • Корпоративные тренировки по волейболу и футболу;
  • Безграничные возможности кросс-функционального взаимодействия и участия в крупных проектах для расширения профессиональной экспертизы;
  • Отличная команда профессионалов с комфортной и дружелюбной рабочей атмосферой.


Посмотрите похожие вакансии

Data Engineer senior (DWH Developer)
Компания: RWB (Wildberries & Russ)
Зарплата: з.п. не указана
Data Engineer Инженер данных
Компания: Займиго МКК
Зарплата: от 280 000 до 280 000 руб.
Senior Data Engineer
Компания: Emphasoft
Зарплата: з.п. не указана
Senior Data Engineer / Tech Lead
Компания: Coral Club
Зарплата: з.п. не указана