Диаграмма «пирог»
Наиболее ярким примером, иллюстрирующим части целого, служит диаграмма «пирог». Она представляет собой круг, разделённый на доли. Диаграмму «пирог» можно встретить на многих рекламных плакатах и буклетах. Однако такой тип диаграмм не несёт полезной информации о статистическом анализе и зачастую не позволяет делать прогнозов. Если диссертант в разделе «Результаты» злоупотребляет таким видом диаграмм, то, скорее всего, со статистической обработкой дела у него шли не очень хорошо. С чем связано такое заявление? Смотрите сами.
Диаграмма «пирог» констатирует только долю того или иного единожды произошедшего события на фоне других единожды произошедших событий. К примеру, с помощью этой диаграммы вы можете сказать, сколько мужчин или женщин приняли участие в исследовании или сколько было курящих и некурящих. То есть она даёт только оценку ретроспективным данным по одному признаку. Вы не можете объективно транспонировать информацию из этой диаграммы на другие временные интервалы или локации. Таким образом, диаграмма «пирог» больше подходит для раздела «Материалы и методы», но не «Результаты».
Приведу пример. В исследовании, которое было выполнено в поликлинике №1, участвовали 70% некурящих и 30% курящих — всего 20 человек (рис. ниже, а). Из этого не следует, что в других поликлиниках в других городах и странах следует ожидать похожих значений. Если бы вы повторили эти измерения многократно в 30 различных учреждениях, вот тогда — другое дело. Но в этом случае следует изображать столбчатую диаграмму с разбросом значений, которые были получены вследствие многократных измерений (рис. ниже, б). А это уже другая ситуация, которая требует изменения подхода к сбору исходных данных.
Таким образом, диаграмма «пирог» подходит для главы «Материалы и методы» в качестве иллюстрации структуры групп исследования. Её также можно использовать для описания результатов ретроспективных исследований.
Диаграмма «часть столбца»
Диаграмма такого типа представляет собой своеобразную смесь диаграммы «пирог» и столбчатой диаграммы. Она является полным эквивалентом диаграммы «пирог», но имеет ряд преимуществ. Во-первых, она имеет более компактный размер. Во-вторых, для её адекватного восприятия достаточно иметь линейку, а не транспортир. Имеется в виду, что визуально проще воспринимаются соотношения линейных размеров, чем угловых. Третье преимущество вытекает из второго: такого рода диаграммы при одинаковых пропорциях можно наглядно сравнивать между собой и располагать на одном графике. В популярном редакторе таблиц Microsoft Excel эти графики называют «диаграмма с накоплением».
Существует 2 главных способа изображения диаграмм «часть столбца»: в абсолютных величинах и в относительных, то есть в исходных значениях и процентах. Какой из этих способов предпочесть, зависит от логики повествования. В научной работе стараются не дублировать, а дополнять данные. Поэтому обычно для абсолютных значений дают так называемые таблицы сопряжения (табл. ниже), которые также содержат информацию о последующей статистической обработке (тест Фишера или χ-квадрат).
Относительные значения в процентах обычно используют для построения графиков, что улучшает визуальное восприятие информации (рис. в начале подраздела). Как видите, таблица сопряжения и диаграмма накопления дают полное представление о распределении исследуемого признака по группам.
Эти графики и таблицы позволяют более обоснованно утверждать, поровну или однородно распределены объекты с тем или иным признаком по группам.
Как видно на графике, различия между группами незначительные и могут быть всего лишь погрешностью, что иллюстрирует результат статистического теста. Без статистического анализа никаких выводов из этой информации сделать невозможно. В связи с этим без статистического анализа вы можете представить эти данные только при описании материалов и методов для демонстрации состава групп.
Следует избегать способа сбора данных, пригодного только для построения диаграмм «часть целого». Проблема заключается в ограничениях способа статистической обработки данных такого рода.
Таким образом, столбчатые диаграммы накопления следует использовать только в случае анализа распределения качественных данных по группам, которые невозможно ранжировать, то есть расставить от меньшего к большему.
Приведу пример. Цвет глаз: голубой, зелёный, карий – очень трудно ранжировать. Зачастую приходится просто считать людей с разным цветом глаз в группах исследований и получать значения в конкретных цифрах, без разброса. В этом случае деваться некуда и следует использовать столбчатую диаграмму накопления для выявления межгрупповых неоднородностей распределения признаков.
Совет: старайтесь уйти от этого типа диаграмм, где это возможно. Для этого старайтесь превратить качественные признаки в количественные.
К качественным признакам можно отнести пол, национальность и статус курения. Однако из последнего качественного признака «курение» на этапе планирования исследования можно сделать количественный признак. Для этого достаточно узнать, сколько сигарет пациент курит в день, и на основании этого получить конкретные цифры, иллюстрирующие тяжесть вовлечения пациента в этот процесс. При использовании количественных данных появляется возможность более детально изучить воздействие признака на изучаемые явления. Так, лучше показать, что курение не просто оказывает влияние, а дать более развёрнутый ответ: сколько сигарет в день способны изменить исследуемый признак. Кроме того, такой подход позволяет более детально верифицировать интенсивность воздействия фактора курения. Например, если все исследуемые — курильщики, то следует исключить факт того, что в одной и той же группе будут лица, выкуривающие в день и одну сигарету, и целый блок. Согласитесь, что это может значительно исказить результаты исследования и не дать возможности увидеть различия там, где они могли бы быть.
Не стесняйтесь комментировать статьи, ставить лайки и подписываться на канал.
© Васильев А.В.
Копирование и распространение без согласия автора не допускается.