Найти тему
Дата Сайентист

Визуализация данных с Matplotlib

Оглавление
clipartz.com
clipartz.com

Matplotlib — это стандартная библиотека визуализации Python для построения 2D-графиков, которая создаёт качественные картинки в различных форматах и интерактивных средах на разных платформах. Matplotlib можно использовать в оболочке Python и IPython, Jupyter Notebook, серверах веб-приложений и графических пользовательских интерфейсов.

Matplotlib — важный инструмент, который позволяет создать впечатляющую визуализацию с помощью Python.

Matplotlib.Pyplot

Одним из основных методов Matplotlib является matplotlib.pyplot. Это набор функций команд Scripting Layer — третьего уровня архитектуры Matplotlib. Каждая функция pyplot вносит некоторые изменения в картинке: например, создает фигуру, создает область построения на фигуре, строит некоторые линии в области построения, украшает график метками и т. д.

Сначала импортируем Matplotlib и Matplotlib.pyplot, проверяем версию и стиль Matplotlib:

-2

В Pandas есть встроенная реализация Matplotlib, поэтому график в pandas строится просто добавлением метода .plot () к ряду или фрейму данных.

Построим линейный график, который отображает информацию в виде серии точек данных, называемых «маркерами», соединенных отрезками прямых линий. Это основной тип диаграмм, распространенный во многих областях, если есть непрерывный набор данных. Они лучше всего подходят для визуализации данных за определенный период времени на основе тенденций.

Иммиграция из России в Канаду

В 1998 году в результате развала СССР из страны начался поток иммиграции в разные страны, в том числе и в Канаду. Это можно визуализировать, используя линейный график.

Сначала извлечем строку данных по России и построим линейный график иммиграции из России с помощью df.plot ().

-3

Pandas автоматически заполнил ось x значениями индекса (годы), а ось y - значениями столбца (численность). Однако обратите внимание, что годы не отображались, потому что они имеют строковый тип. Поэтому изменим тип значений индекса на целочисленный для построения графика.

Обозначим заголовок, оси y и x с помощью plt.title (), plt.ylabel () и plt.xlabel () следующим образом:

-4

На графике видно, как число иммигрантов из России резко увеличилось с 1998 года после развала СССР. Можно отметить этот всплеск на графике с помощью метода plt.text ().

-5

Другие графики в Matplotlib

Другие доступные стили для построения графиков можно получить, передав ключевое слово kind в plot (). Полный список доступных стилей выглядит следующим образом:

  • bar — для графиков с вертикальной полосой
  • barh — для горизонтальных графиков
  • hist — для гистограммы
  • box — ящик с усами
  • kde — для графиков плотности
  • area — диаграмма области
  • pie — для круговой диаграммы
  • scatter — для графиков разброса
  • hexbin — гексагональная диаграмма.

Наука
7 млн интересуются