MTS AI это компания внутри экосистемы МТС. У нас царит атмосфера стартапа, новые продукты, никакого легаси, небольшие команды, с дружественной атмосферой. Мы занимается разработкой уникальных продуктов в сфере искусственного интеллекта: NLP, CV, ASR, биометрия, чат-боты, hardware AI.
Основные источники данных - звук, изображения, текст.
Чем предстоит заниматься:
ручная и автоматизированная загрузка и выгрузка сырых данных, обработка и организация хранения неструктурированных данных;
администрирование данных и доступов к ним;
ведение реестра датасетов, сбор и обновление метаинформации;
улучшение качества данных, очистка;
документирование и обеспечение соблюдения правил сбора, хранения и использования данных;
разработка и поддержка сопроводительной документации, развитие и поддержка базы знаний по вопросам работы с данными;
предоставление экспертной поддержки внутренним потребителям по вопросам, связанным с использованием данных;
проектирование схем хранения данных;
автоматизация data-pipelines, ETL ELT-процессов;
развертка и поддержка разработки на удаленном сервере.
Что мы ожидаем:
bash, git, linux, docker, python;
опыт работы с k8s;
работа с оркестраторами типа Airflow;
понимание жизненного цикла данных;
умение работать с документацией;
готовность разбираться в чужих скриптах;
желание развиваться в этой сфере.
Будет вашим преимуществом:
опыт работы с S3, BI-инструментами, Airflow, ClearML WanDB;
опыт работы с процессами и инструментами обеспечения качества данных.
Что мы предлагаем: