19 марта 2025
Руководство командой разработчиков и аналитиков в области обработки данных и машинного обучения.
Проектирование и развитие архитектуры обработки данных с использованием Hadoop, Spark, Hive/Impala.
Разработка ETL-процессов с использованием AirFlow.
Оптимизация работы с промышленными DWH на основе MPP СУБД (Teradata, Exadata, Greenplum).
Участие в разработке ML-моделей, анализе данных, а также применении LLM (больших языковых моделей).
Интеграция и работа с API (Hugging Face, Open AI API, Mistral и др.).
Организация процессов CI/CD и управление кодовой базой с использованием Git.
Взаимодействие с бизнес-подразделениями, формирование требований и контроль за их реализацией.
Ведение документации и обучение команды новым технологиям и инструментам.
Глубокое понимание Hadoop, Spark, Hive/Impala.
Опыт разработки на Python/Scala.
Знание концепций DWH и принципов работы MPP СУБД (Teradata, Exadata, Greenplum).
Уверенное владение инструментами ETL (AirFlow).
Опыт работы с банковскими данными.
Понимание архитектуры LLM и основных методов машинного обучения (линейные модели, ансамбли, временные ряды).
Знание инструментов Embeddings, Hugging Face, Mistral, Open AI API.
Базовые навыки работы с Kubernetes (как плюс).
Лидерство и управление командой: умение вдохновлять, организовывать процессы, мотивировать и развивать сотрудников.
Коммуникация: способность ясно формулировать идеи, договариваться с бизнесом и техническими специалистами.
Навыки наставничества: готовность делиться знаниями, обучать и помогать команде расти.
Гибкость и адаптивность: способность быстро перестраиваться под новые задачи и технологии.
Структурное мышление: умение анализировать сложные проблемы, разрабатывать стратегии их решения.