Мы команда Даты в логистике, которой развивает культуру работы с данными и их применения для принятия ключевых стратегических и операционных решений. И для этого нам нужен опытный дата инженер.
В команде есть 3 ключевых направления:
Обязанности:
Интеграция данных из систем источников в хранилища данных (ETL/ELT);
Создание и развитие хранилища для около риал тайм данных (Postgres);
Создавать и улучшать процессы обработки данных;
Принимать участие в создании интеграций новых источников в DataLake;
Принимать участие в архитектурных решениях;
Разрабатывать процедуры формирования детального слоя данных и слоя витрин (GP, Postgres);
Реализовывать процессы CI/CD и мониторинга разработанных процессов обработки данных (Grafana, Prometheus);
Покрывать интеграции и расчеты витрин проверками качества данных;
Документировать свою работу в Яндекс Вики;
Работать в Яндекс Трекере;
Работа с инцидентами в ITSM инструменте.
Требования:
Знания принципов работы БД, построения ХД;
Опыт разработки ETL процессов (NiFi, Flink);
Имеет опыт работы с системами контроля версий (Git);
Опыт работы с высоконагруженными системами хранения и обработки данных;
Отличное знание SQL, опыт оптимизации запросов (GreenPlum, Postgres);
Опыт самостоятельного ведения проектов;
Опыт разработки на Python;
Желание обучаться и развиваться;
Понимание работы брокеров сообщений (Kafka);
Опыт работы с Machine learning моделями будет плюсом (Kubernetes, Kuberflow).
Что мы готовы предложить: