Найти в Дзене

Картограммы в R. Часть 1

Статья подготовлена для студентов курса «Прикладная аналитика на R» в образовательном проекте OTUS.

Визуализация данных в R — крайне обширная и разнообразная тема. Существует большое количество как и самих форм презентации информации (т. е. самих видов графиков), так и пакетов, расширяющих возможности языка под отдельные задачи. В частности, R способен визуализировать пространственные данные посредством картограмм. В данном посте и пойдёт речь об этом не самом распространённом виде диаграмм.

Небольшая ремарка: подобные графики корректнее называть картограммами, а не картами, поскольку карты — это чертёж земной (в нашем случае) поверхности, а картограмма — способ изобразить статистические данные в пространстве. Но для краткости мы всё равно будем называть их «картами».

Пакеты для карт

С картами в R справится как и обычный plot(), так и средства пакетов ggplot и ggmap.

-2

Откуда берутся карты?

Говоря простым языком, карту можно представить в виде точек, линий и многоугольников (полигонов), в зависимости от того, что именно планируется изобразить. У нас речь пойдёт про регионы, поэтому будем рисовать полигоны.

Проще всего скачать уже готовую карту и сразу начать с ней работать. В R для этой цели можно использовать файлы с расширениями .shp (shape-файлы) и geoJSON.

В качестве примера можно взять какой-нибудь свободный набор данных, например, здесь:

-3

Получим объект с 2 полями (название региона — субъекта и какого округу он принадлежит) и 83 записями (83 региона в России). Объект shape-файла несколько отличается от привычных в R объектов: обращаться к его полям всё ещё можно через $, однако самое важное находится в слотах — к ним можно обратиться через @.

Структуру в этой заметке мы приводить не будем, из важного заметим, что помимо названий регионов, объект содержит координаты полигонов (границ регионов), а также используемый метод проекции.

-4

Первые 10 строчек

-5

Что же, теперь займёмся самым интересным — «рисовашками». Но об этом поговорим в следующей части!

Приглашаем 10 июля на открытый урок «Применение R в финансах на примере их различий c Python».
R - это инструмент, который популярен как среди ученых и исследователей, так и в коммерческих компаниях. На вебинаре разберем преимущества языка R в аналитике в финансовом секторе.
Преподаватель: Михаил Смуров занимается коммерческой разработкой на языке R и других языках программирования (С++, Java, C#) с конца 2013 года.
ЗАПИСАТЬСЯ