Задание: Программист баз данных. Найти разные значения в таблице эксель (Дистанционная работа)
Есть файл эксель.
Анализ и визуализация данных цифрового обучения
Описание ситуации и задача
Вы работаете аналитиком компании, которая занимается цифровым обучением.
Руководство хочет понять, есть ли факт фальсификации обучения, аномалии в данных и просит Вас проанализировать данные, которые хранятся в базе.
Описание данных:
mename - наименование мероприятия
meeduform - форма обучения
mecontenttype - тип курса
mestartdate - дата начала курса
meenddate - дата окончания курса
mmfinishstatus - статус прохождения
mrattemptcount - количество попыток
mrprocent - процент прохождения мероприятия
mrscore - оценка (в процентах)
mrstarttime - дата начала прохождения
mrendtime - дата окончания прохождения
mrlastaccesstime - дата последнего доступа к курсу
mrduration - длительность мероприятия
mmdregistrationdate - дата регистрации на мероприятия
personid - ID пользователя
Что нужно сделать
Изучите данные и подготовьте ответы на вопросы руководства. Вы можете использовать любой инструмент.
Вопросы:
1.1 Какое среднее, минимальное и максимальное время прохождения курса? Есть ли аномально короткие или длинные прохождения? Какой вид имеет распределение времени прохождения?
1.2 Какое среднее, минимальное и максимальное количество попыток? Есть ли аномалии в данных? Какой вид имеет распределение количества попыток?
1.3 Какой средний, минимальный и максимальный процент прохождения? Есть ли аномалии в данных? Какой вид имеет распределение процента прохождения?
1.4 Какая средняя, минимальная и максимальная оценка? Есть ли аномалии в данных? Какой вид имеет распределение оценок?
1.5 Существует ли корреляция между количеством попыток и временем прохождения?
1.6 Существует ли корреляция между процентом прохождения мероприятия и оценкой за мероприятие?
1.7 Выделите из наименования мероприятия дорогу. Ответьте на вопросы выше отдельно для каждой дороги. Выделите ТОП-5 дорог с наименьшим средним временем прохождения мероприятий.
1.8 * Изучите датасет. Выявите некорректные / аномальные данные по Вашему мнению. Сделайте выводы.