31 октября 2024
WhoIsBlogger (WIB) это Influencer Marketing в цифрах. Мы независимо оцениваем аудиторию более 1 000 000 российских блогеров в социальных сетях с помощью информации о 50+ миллионах их подписчиков и создаваемом контенте. Используем большие массивы данных как из открытых источников, так и от официальных партнеров (телеком-операторы, ритейлеры, финансовые организации), а также благодаря уникальным алгоритмам собственной разработки.
Наши продукты (B2B SAAS) помогают крупнейшими брендам из FMCG, Pharma, Beauty, E-Сommerce, Retail, IT и других отраслей максимально эффективно планировать медийные и креативные стратегии коммуникации со своими потребителями, оптимизировать блогерские кампании и оценивать эффект от реализованных проектов. Мы делаем много кастомных проектов и стремимся упаковывать их в понятные и простые продукты, которыми клиенты могут пользоваться самостоятельно.
Мы находимся в зоне растущего спроса и ищем активного Data Engineer в дополнение текущей команде!
Обязанности:
Автоматизация различных задач, связанных со сбором и обработкой данных
Проектирование структуры хранения и доставки данных
Оптимизация процессов обработки и запросов к данным
Подготовка и очистка данных с использование современных инструментов обработки данных (SQL Presto/Trino, Python (Apache Airflow))
Контроль качества данных, поиск и устранение аномалий
Коммуникация с внутренними заказчиками для детализации функциональных требований к продукту
Требования:
Ответственность, желание учиться, внимательность, аккуратность, высокая работоспособность
Хорошее знание SQL в области аналитических запросов и трансформации данных
Знание Python: умение написать свой класс с методами; обрабатывать и преобразовывать данные из различных источников.
Желание расти и развиваться
Хорошие коммуникативные навыки: умение понятно описывать свои идеи, способы решения задач и презентовать результаты работы
График работы 40 часов в неделю
Плюсом будет:
Высшее образование в технической отрасли
Опыт решения задач, связанных с обработкой данных, с использованием таких инструментов, как Trino/Presto SQL, Apache Spark
Опыт работы с Apache Airflow
Понимание физической логики исполнения запросов к БД (планы запросов)
Знание Java / Scala
Опыт работы с ClickHouse
Опыт работы с Elasticsearch
Опыт работы с Jira / Confluence / Jenkins
Опыт работы с Github, командная разработка
Опыт работы с одной из ведущих облачных платформ (AWS, Azure, GCP)
Условия: