Визуализация данных — это большая часть работы специалистов в области data science. На ранних стадиях развития проекта часто необходимо выполнять разведочный анализ данных (РАД, Exploratory data analysis (EDA)), чтобы выявить закономерности, которые обнаруживают данные. Визуализация данных помогает представить большие и сложные наборы данных в простом и наглядном виде. На этапе окончания проекта важно суметь отчитаться о его результатах так, чтобы даже непрофессионалам, не обладающим техническими знаниями, всё стало ясно и понятно...
В этой статье я покажу, как быстро и просто визуализировать данные, которые представлены в виде таблицы Excel или CSV-файла. Визуализировать будем при помощи библиотек pandas и matplotlib, используя обычный график, гистограмму и круговую диаграмму ("пирог"). Готовим данные Для этой статьи я нашел на просторах сети файл со статистическими данными, в котором были собраны популярные "русские" имена на просторах Америки. Некоторые имена показались мне странными, но правдивость данных не тема этой статью, поэтому перейдем к делу...