30 июня 2026
Мы команда платформы данных в направлении Trust & Safety. Делаем данные и признаки для моделей машинного обучения, которые используются в антифроде, модерации контента и других продуктах. У нас есть как потоковая платформа (Databus/Kafka + Flink + Redis/Cassandra), так и озеро данных на S3/Apache Iceberg с доступом через Trino.
Мы ищем дата-инженера, который обеспечит расчёт и поставку признаков для ML-моделей от чтения сырых событий до записи финальных значений в онлайн- и офлайн-хранилища.
Стек: Databus(Redpanda)/Kafka, Apache Flink, Redis, Cassandra, S3, Apache Iceberg, Trino, ClickHouse, Airflow, Python, dbt.
Вам предстоит:
Вы нам подходите, если: