25 декабря 2024
Мы команда Газпромнефть Цифровые решения , часть ИТ-функции Газпром нефти . Команда, которая научила нейросети находить нефть, запустила первую в мире цифровую систему управления арктической логистикой и первой в мире заправила самолет по блокчейн. Мы переводим в цифру каждый этап работы современного нефтяника: от геологической разведки и бурения скважин до процесса переработки нефти и момента, когда она в виде топлива попадает в баки автомобиля, самолета или, например, становится битумом для строительства дорог. Активы Газпром нефти это сотни петабайт данных, которые генерируют объекты компании в России и за рубежом. Нас вдохновляет идея развития цифрового будущего нефтегазовой отрасли и промышленности в целом.
Проект разработки корпоративного хранилища данных реализуется на стеке: MPP Greenplum, ETL платформы Informatica PowerCenter, Airflow, Apache NiFi и других инструментах. Работа в команде, выполняющей внедрение стратегии, процессов и инструментария управления корпоративными данными (Data Governance). Нам нужен разработчик.
Обязанности:
Построение корпоративного хранилища данных (КХД) по методологии Data Vault 2.0 на базе Arenadata DB (Greenplum);
Разработка и поддержка интеграционных потоков c различными источниками данных Informatica PowerCenter (Developer), Airflow, Apache NiFi;
Участие в оптимизации/автоматизации процесса разработки, подготовке шаблонов и методик, проектной документации;
Апробация новых инструментов разработки и систем в рамках развития КХД;
Обеспечение непрерывной работы хранилища данных.
Требования:
Опыт разработки ETL потоков в ETL инструменте, включая задачи анализа и оптимизация ETL процессов;
Опыт работы с базами данных MSSQL (либо Oracle, DB2, PostgreSQL), написания сложных SQL запросов и оптимизации производительности;
Понимание схемы проектирования хранилищ данных по различным методологиям (Data Vault, Anchor Modeling и т.д.);
Опыт работы с высоконагруженными системами;
Опыт формирования технических спецификаций на разработку;
Английский язык на уровне чтения технической документации.
Будет плюсом:
ETL Informatica PowerCenter;
Greenplum или подобными MPP решениями (Teradata, Exadata, Vertica и т.д.);
Мы предлагаем:
В Газпром нефть ты можешь: