Найти тему
График в виде пончика (donut) в RStudio
#webr График в виде пончика (donut) отлично подходит для визуализации подсчета наблюдений, характеризующихся определенным признаком. Например, Вам нужно количественно показать, насколько численность группы А отличается от группы Б. В роли признака выступает тип группы (А или Б). Бывает, что существует два уровня аналитики: внутри групп А и Б существуют подгруппы. Тогда на руку использование «stacked donut»...
1 год назад
Встроенная функция для подсчета шкалы Лайкерта в RStudio
#likert В R можно найти встроенную функцию для подсчета шкалы Лайкерта, где есть уровни «Agree», «Disagree», «Strongly Agree», «Strongly disagree». Далее через plot можно визуализировать получившиеся результаты. Стоит отметить, что вместо шкалы Лайкерта можно задавать также обычные категориальные переменные, но единственное отличие будет...
1 год назад
График водопада при анализе отчета о финансовых результатах (P&L statement) в RStudio
#ggplot2 #waterfalls #finance_in_R График водопада часто используется при анализе отчета о финансовых результатах (P&L statement). Данный график можно построить и в R. В функцию waterfall достаточно добавить на вход значения и имена, и она автоматически построит и покажет итоговый результат (в этом случае итоговый результат - Net Income)...
1 год назад
Cтандартный график geom_col() и хордовая диаграмма в RStudio
В первом вложении приведен стандартный график geom_col(). На соседней гиф анимации хордовая диаграмма, построенная на тех же данных и отражающая то же самое, что и первый график. В 1 и 2 квандрантах приведены категории: High, Low и Neutral (сортировка по ожидаемой продолжительной жизни с использованием датасета gapminder). В 3 и 4 квандрантах – континенты. Ширина линий, выходящих из верхних квандрантов...
1 год назад
95%-ый доверительный интервал в RStudio
#graph_R #ggplot2 95%-ый доверительный интервал отображает верхнюю и нижнюю границы интервала, где лежат 95% наблюдений выборки (по правилу 3-х сигм). Доверительный интервал можно добавить на график посредством функции geom_errorbar...
150 читали · 1 год назад
Функция geom_area в RStudio
#graph_R #ggplot2 Посредством функции geom_area можно добавлять «заливку» к линейному графику. При этом, если категория разбиения (аргумент «fill») представлена в столбце, то может строиться некорректный график (график №1). Происходит не разбиение по странам, а «наклейка» одной страны на другую, что будет мешать интерпретации. Один из путей решения проблемы – размещение стран по столбцам датасета и создание слоев (график №2)...
1 год назад
Анимированные графики в RStudio
#graph_R #ggplot2 #gganimate Ранее редакция писала некоторый пост про анимированный график. Информация добавлена на RPubs. Анимированные графики можно сделать посредством применения функции transition_reveal к переменной, по которой хотите отразить динамику, и к стандартному графику ggplot. В данном случае для линейного графика (geom_line) применен transition_reveal к переменной года. Вдобавок, применена группировка по странам, что позволяет сопоставить динамику определенного показателя (например, ожидаемая продолжительность жизни) сквозь года...
1 год назад
Визуализация различных статистических тестов с помощью пакета ggstatsplot в RStudio
#graph_R #ggstatsplot Пакет ggstatsplot отлично визуализирует различные статистические тесты. Так, t-тест на равенство определенному значению иллюстрируется посредством гистограммы grouped_gghistostats. При этом, тестирование на равенство определенному значению можно производить по разным группам объектам. Так, в рамках моего датасета было разделение выборки на Fair, Good, Very Good, Premium и Ideal...
1 год назад
Облака слов в RStudio
#graph_R #wordcloud Посредством R можно формировать облака слов – наиболее часто встречающиеся слова в отрывке текста. При каждой генерации будут формироваться разные облака, но самые часто встречающиеся слова останутся теми же...
1 год назад
Микс диаграммы рассеивания с гистограммой в RStudio
#graph_R #ggplot2 #ggExtra Диаграмму рассеивания можно скомбинировать вместе с гистограммой (histogram), графиком плотности распределения (density) и ящиком с усами (boxplot), отобразив распределение по каждой переменной. Построив стандартный график в ggplot...
1 год назад
Upset график в RStudio
#graph_R #ComplexUpset Для отображения количества наблюдений, характеризующихся определенными характеристиками по бинарным переменным, отлично подходит upset график. Данный график состоит из трех панелей: • 1 панель – отражает количество наблюдений, у которых определенная бинарная переменная = 1 (например, переменная gender = 1 в 2488 случаях) • 2 и 3 панели дополняют друг друга. На панели 2 – в количественном выражении, на панели 3 отражена комбинация бинарных переменных необходимая для достижения определенного количества наблюдений с определенными признаками...
1 год назад
Различие качественных признаков по количеству coord_polar и coord_curvedpolar в RSudio
#graph_R #ggplot2 #geomtextpath Показать различие качественных признаков по количеству (например, количество сотрудников в отделе, распределение компаний по отраслям) может помочь график barplot (столбиковая диаграмма) или круговой график (через coord_polar). Затронем второй тип графика. Стоит отметить, что он смотрится наглядно и красиво в следующих случаях: 1) Количество качественных признаков не больше 6-7 (иначе нагромождено) 2) Маленькое количество качественных...
1 год назад