Вакансия: Data Engineer
Мы строим единую аналитическую платформу, включающую в себя централизованное корпоративное хранилище данных, витрины отчетности и BI-инструменты, аналитические песочницы данных и инфраструктуру для применения моделей искусственного интеллекта.
Какие задачи ждут именно вас:
- Проектирование и разработка процессов загрузки данных в единое хранилище данных Apache Hadoop;
- Оптимизация и настройка производительности ETL процессов (Apache Airflow, Oozie, Pentaho);
- Проведение исследований новых технологий в рамках R&D;
- Рефакторинг существующих решений по загрузке данных, перевод их на новую модель и инструменты.
Мы ждем от вас:
- Опыт работы c Linux (Centos/Ubuntu), Docker
- Опыт работы с экосистемой Apache (HDFS, Hive/Spark, Apache Airflow);
- Уверенные знания одного из языков Python/Java/Scala;
- Сильные знания SQL;
- Кругозор в сфере ИТ;
- Навык создания, структурирования и применения организации потоков данных (pipelines);
Мы НЕ ждем от вас специфичных глубоких знаний по инструментам и технологиям для работы с BIG DATA, мы готовы делиться опытом и помогать нашим коллегам успешно осваивать новые технологии;
Будет плюсом:
- Опыт ML(catboost,lightgbm)/DL(pytorch,tensorflow)/Web(fastapi,django,flask)/Ansible/MLFlow.
- Опыт работы с промышленными ETL средствами (Informatica, Pentaho, IBM Datastage);
Опыт работы в распределённой (территориально) команде.
Мы готовы предложить:
- З/п по итогам технического собеседования и оформление в штат;
- Интересные проекты, адекватное руководство и квалифицированная проектная команда с огромным опытом;
- Возможность профессионального и карьерного роста;
- Топовое железо (I7, SSD, 32gb ddr4 + 2 Монитора либо аналогичный laptop);
- Возможность работать как удаленно, так и на территории работодателя: комфортные офисы в г. Калининград и г. Москва;
- Интересные корпоративные мероприятия.