Для повторения базового функционала библиотеки pandas выполнил небольшое исследование пользователей сервиса Яндекс музыка. Цель исследования — проверить три гипотезы: Таким образом, исследование проведено в три этапа: 1. Обзор данных. 2. Предобработка данных. 3. Проверка гипотез. В данных есть пропущенные значения В названиях колонок видны нарушения стиля: Предобработка обнаружила три проблемы в данных: Исправили заголовки, чтобы упростить работу с таблицей. Без дубликатов исследование станет более точным. Пропущенные значения заменили на 'unknown'. Ещё предстоит увидеть, не повредят ли исследованию пропуски в колонке genre Данные показывают разницу поведения пользователей: Значит, данные говорят в пользу первой гипотезы. Если сравнить топ-10 жанров в понедельник утром, можно сделать такие выводы: Вечер пятницы не меняет эту картину. Некоторые жанры поднимаются немного выше, другие спускаются, но в целом топ-10 остаётся тем же самым. Таким образом, вторая гипотеза подтвердилась лишь