В этой статье я покажу, как быстро и просто визуализировать данные, которые представлены в виде таблицы Excel или CSV-файла. Визуализировать будем при помощи библиотек pandas и matplotlib, используя обычный график, гистограмму и круговую диаграмму ("пирог"). Готовим данные Для этой статьи я нашел на просторах сети файл со статистическими данными, в котором были собраны популярные "русские" имена на просторах Америки. Некоторые имена показались мне странными, но правдивость данных не тема этой статью, поэтому перейдем к делу...
Сегодня будем прорабатывать навык использования средств группирования и визуализации данных в Python. В предоставленном датасете на Github проанализируем несколько характеристик и построим набор визуализаций.
По традиции, в начале, определим цели:
Меньше слов, больше кода!
И, поехали. Сгруппируем данные по полу и году и визуализируем общую динамику рождаемости обоих полов Найдем самые популярные имена за всю историю Разобьём весь временной промежуток в данных на 10 частей и для каждой найдем самое популярное имя каждого пола...