Вакансия: Разработчик хранилищ данных DWH/ETL (можно удаленно)
Разработчика хранилищ данных Чем предстоит заниматься: Создание хранилища данных и Data Lake одного из крупнейших логистических операторов России; Разработка алгоритмов преобразования и анализа данных с использованием технологий MPP СУБД и инструментов экосистемы Hadoop для обработки больших данных; Проведение предпроектных обследований (определение объема работ, продолжительности работ, ресурсов для их выполнения); Самостоятельная разработка и проектирование потоков данных, алгоритмов загрузки и обработки данных в аналитическую БД и Hadoop; Оценка кода и предложение по улучшению архитектуры и используемых инструментов в рамках стратегии развития платформы данных; Оптимизация и настройка производительности ETL-процессов; Оптимизация процессов, внедрение Code Review, CI/CD практик в разработку; Документирование разработанного кода; Руководство группой разработчиков, поиск и обучение персонала, формирование команды; Постановка задач и контроль и выполнения внутри проектной команды. Что мы ждем от кандидата: Уверенные знания SQL и принципов работы реляционных БД; Опыт оптимизации производительности запросов; Опыт работы с промышленными ETL; Базовые знания Python. Будет плюсом: Знакомство с архитектурой MPP баз данных, в том числе с колоночным хранением: Знакомство с экосистемой Hadoop (HDFS, Hive, Spark). Мы предлагаем: Возможность работать удаленно; Интересные задачи и опытную команду; Комфортные и стабильные условия для работы; Возможности для профессионального роста; Рабочий график 9:30—18:00 (может смещаться); в пятницу до 16:00 Оформление по ТК РФ. Оклад белый квартальные премии до 15 % от квартального дохода; Также есть офис: г. Москва, ул.Электрозаводская (7 мин от метро Преображенская площадь или 15 мин от метро Электрозаводская). Есть парковка.