Программист баз данных. Найти разные значения в таблице эксель (Дистанционная работа)

Бюджет не указан

Задание: Программист баз данных. Найти разные значения в таблице эксель (Дистанционная работа)

Есть файл эксель. Анализ и визуализация данных цифрового обучения Описание ситуации и задача Вы работаете аналитиком компании, которая занимается цифровым обучением. Руководство хочет понять, есть ли факт фальсификации обучения, аномалии в данных и просит Вас проанализировать данные, которые хранятся в базе. Описание данных: mename - наименование мероприятия meeduform - форма обучения mecontenttype - тип курса mestartdate - дата начала курса meenddate - дата окончания курса mmfinishstatus - статус прохождения mrattemptcount - количество попыток mrprocent - процент прохождения мероприятия mrscore - оценка (в процентах) mrstarttime - дата начала прохождения mrendtime - дата окончания прохождения mrlastaccesstime - дата последнего доступа к курсу mrduration - длительность мероприятия mmdregistrationdate - дата регистрации на мероприятия personid - ID пользователя Что нужно сделать Изучите данные и подготовьте ответы на вопросы руководства. Вы можете использовать любой инструмент. Вопросы: 1.1 Какое среднее, минимальное и максимальное время прохождения курса? Есть ли аномально короткие или длинные прохождения? Какой вид имеет распределение времени прохождения? 1.2 Какое среднее, минимальное и максимальное количество попыток? Есть ли аномалии в данных? Какой вид имеет распределение количества попыток? 1.3 Какой средний, минимальный и максимальный процент прохождения? Есть ли аномалии в данных? Какой вид имеет распределение процента прохождения? 1.4 Какая средняя, минимальная и максимальная оценка? Есть ли аномалии в данных? Какой вид имеет распределение оценок? 1.5 Существует ли корреляция между количеством попыток и временем прохождения? 1.6 Существует ли корреляция между процентом прохождения мероприятия и оценкой за мероприятие? 1.7 Выделите из наименования мероприятия дорогу. Ответьте на вопросы выше отдельно для каждой дороги. Выделите ТОП-5 дорог с наименьшим средним временем прохождения мероприятий. 1.8 * Изучите датасет. Выявите некорректные / аномальные данные по Вашему мнению. Сделайте выводы.