Вакансия: Lead Data Engineer
Описание вакансии
Evocargo создает транспорт будущего. Мы проектируем, конструируем и собираем автономные электро-грузовики, разрабатываем программное обеспечение беспилотников и низкоуровневых компонентов. Мы разрабатываем и внедряем под ключ автономные логистические решения полного цикла, которые уже сейчас доступны в закрытых производственных помещениях и на контролируемых территориях.
У нас атмосфера технологической компании. Мы быстро разрабатываем и внедряем, получаем моментальный фидбек, постоянно улучшаем систему и процессы, исследуем сферу автономного транспорта, пишем научные статьи, обсуждаем идеи и поддерживаем друг друга.
Что делает команда и кого мы ищем:
Мы "Отдел восприятия" отвечаем за зрение нашего беспилотного автомобиля . Наша команда создает и обучает нейросетевые модели, которые формируют детальную и точную картину окружающего мира. Качество и скорость разработки моделей напрямую зависит от количества и уровня подготовки данных. Сегодня мы активно работаем с данными камер и лидаров, и в будущем планируем начать работать с радарами для создания ещё более надежной мультимодальной системы
Мы ищем Руководителя группы инфраструктуры данных , который будет отвечать за весь жизненный цикл: от получения сырых данных с сенсоров до их превращения в готовые датасеты для обучения моделей. Ваша задача вывести инфраструктуру на новый уровень зрелости, сделав её надёжной и масштабируемой.
Вам предстоит:
- Переосмыслить текущую архитектуру инфраструктуры: создать видение новой системы хранения, обработки и подготовки данных, а затем реализовать его от плана до работающих решений;
- Руководить командой инженеров: планировать задачи, распределять работу, проводить код-ревью и развивать экспертизу, расширяя команду по мере роста;
- Обеспечивать кросс-функциональное взаимодействие с командами ML-инженеров и асессоров.
От будущего коллеги мы ждем:
- Уверенное владение языком программирования Python;
- Опыт работы в среде Linux;
- Знание библиотек для обработки данных (pandas, numpy и др.);
- Опыт проектирования, оптимизации и поддержки масштабируемых ETL-пайплайнов;
- Опыт проектирования и работы с облачными хранилищами (S3, Data lake, Data wa rehouse);
- Опыт проектирования баз данных (SQL, NoSQL);
- Опыт работы с Docker и выстраивания процессов непрерывной интеграции и доставки на основе GitLab CI;
- Опыт управления небольшой командой.
Будет плюсом:
- Понимание принципов работы ML-моделей;
- Опыт работы с MLOps-инструментами (ClearML, MLflow);
- Опыт работы с системами версионирования данных (например, DVC);
- Опыт работы с орк естр аторами (Prefect, Airflow);
- Опыт работы с инструментами и процессами разметки данных;
- Знакомство с системой ROS;
- Работа с Telegram Bot API.
Почему вам у нас понравится:
- Формат работы - офис/гибрид/удалёнка. Офис у нас уютный, продуманный и с террасой. Находится в технопарке "Калибр" в 10 минутах от м. Алексеевская.
- Возможность узнать все про мир беспилотного транспорта;
- Оформление по ТК РФ;
- Аккредитованная ИТ-компания
- ДМС со стоматологией;
- Интересные задачи, нацеленные на развитие высокотехнологичных самодвижущихся транспортных средств;
- Мы открыто делимся фидбеком, не боимся прямо говорить о том, что сделано плохо, но при условии, что критика выражена конструктивно и с уважением к другим.