Сбор, очистка и предобработка данных для задач анализа и машинного обучения
Разведочный анализ данных (EDA): визуализация, поиск закономерностей, проверка гипотез
Подготовка признаков (Feature Engineering) и формирование датасетов для обучения моделей
Участие в разработке и обучении ML-моделей под руководством наставника
Оценка качества моделей, анализ метрик и подготовка выводов по результатам экспериментов
Оформление результатов работы: аналитические записки, комментарии к коду
Важно: вы будете работать с реальными боевыми задачами клиентов из ритейла, e-commerce, медицины и других отраслей не с учебными датасетами.
Требования:
Знание Python на уровне уверенного пользователя: функции, структуры данных, работа с файлами
Опыт работы с pandas и Jupyter Notebook уверенный навык манипуляции с табличными данными
Базовое понимание анализа данных и машинного обучения (пройденные курсы: Яндекс.Практикум, Coursera, Stepik, Карпов.Курсы или аналогичные)
Умение читать техническую документацию и разбираться в новых библиотеках самостоятельно
Готовность учиться, задавать вопросы и работать в связке с наставником
Будет плюсом:
Продвинутое знание Python: ООП
Опыт работы в PyCharm или VS Code
Умение эффективно использовать ChatGPT / аналоги как инструмент для ускорения работы (генерация кода, поиск решений, отладка)
Базовые знания SQL
Условия:
Персональный наставник за вами закрепляется опытный ML-инженер, который помогает разбираться в задачах, проводит код-ревью, челленджит ваши решения и направляет профессиональный рост
Боевые проекты с первого дня работа с реальными данными и задачами клиентов, а не на учебных примерах
Удалённый формат работы
Гибкий график: от 20 часов в неделю
Возможность перехода на полную ставку по результатам работы