Найти в Дзене
Art of Data&Statistics

Дисперсионный анализ (ANOVA). Практическая реализация в STATISTICA: базовый вариант (Quick, Быстро)

В качестве примера, требующего использования дисперсионного анализа, можно рассмотреть исследование влияния соединений А и В в условиях многодневного введения на уровень АД (артериального давления) крыс линии SHR. Контрольной группе животных данной линии вводили физиологический раствор. В программе STATISTICA реализовано два способа анализа данных с помощью ANOVA - с помощью специального модуля: ANOVA, и с помощью пункта Breakdown & one-way ANOVA (Классификация и однофакторный дисперсионный анализ) модуля Basic Statistics and Tables . Для выполнения анализа данного типа необходимо внести в таблицу результаты исследования в соответствии с правилами оформления данных для независимых групп. То есть, в одном столбце (1) будет находиться группирующая переменная (фактор "вещество", Drug) с соответствующими тремя градациями - Saline (физ.раствор), A (вещество А) и B (вещество В). В другом столбце (2) внесены значения зависимой переменной - значения артериального кровяного давления (Blood-pre

В качестве примера, требующего использования дисперсионного анализа, можно рассмотреть исследование влияния соединений А и В в условиях многодневного введения на уровень АД (артериального давления) крыс линии SHR. Контрольной группе животных данной линии вводили физиологический раствор.

-2

В программе STATISTICA реализовано два способа анализа данных с помощью ANOVA - с помощью специального модуля: ANOVA, и с помощью пункта Breakdown & one-way ANOVA (Классификация и однофакторный дисперсионный анализ) модуля Basic Statistics and Tables .

Для выполнения анализа данного типа необходимо внести в таблицу результаты исследования в соответствии с правилами оформления данных для независимых групп. То есть, в одном столбце (1) будет находиться группирующая переменная (фактор "вещество", Drug) с соответствующими тремя градациями - Saline (физ.раствор), A (вещество А) и B (вещество В). В другом столбце (2) внесены значения зависимой переменной - значения артериального кровяного давления (Blood-pressure).

-3

Чтобы обработать эти данные, нам необходим самый простой и базовый вариант ANOVA: однофакторный дисперсионный анализ. Для этого в главном меню необходимо нажать на вкладку Statistics (Статистики), и войти в модуль Basic Statistics and Tables (Основные статистики и таблицы). Из открывшегося списка выбрать пункт Breakdown & one-way ANOVA (Классификация и однофакторный дисперсионный анализ).

-4

Перед нами появляется диалоговое окно с Breakdown & one-way ANOVA, по умолчанию открытое на вкладке Individual tables. Во вкладке Lists of tables мы также можем увидеть кнопку выбора переменных, но ещё плюс некоторые другие поля с опциями. Её мы пока рассматривать не будем.

-5

Итак, нажав на кнопку Variable, мы переходим в поле выбора переменных. Выбирается зависимая переменная (Dependent variables) и группирующая переменная (Grouping variables), с помощью которой зависимые переменные (Dependent) разбиваются на группы. Группирующей переменной в нашем примере является переменная Drug, и с её помощью значения Blood-pressure (Dependent) группируются, исходя из того, какое вещество, Drug, мы вводили - Saline, вещество А или вещество В.

-6

Нажав на кнопку Factor Codes for grouping variables, мы указываем программе, что необходимо проанализировать все экспериментальные группы. Для этого мы нажимаем All, в поле отображаются все градации группирующей переменной от Saline до В. Нажимаем ОК...

-7

Теперь мы вернулись в диалоговое окно с Breakdown & one-way ANOVA, но видим, что переменные выбраны и указано, что необходимо проанализировать все экспериментальные группы (Selected).

-8

Нажимаем ОК.

-9

В результате появится окно с 4 вкладками, автоматически открытое на вкладке Quick (Быстро), и 6 кнопками. При помощи кнопок и опций этого окна в удобном виде можно просмотреть результаты обработки сгруппированных данных. В самой верхней строке указаны переменные, и можем убедиться, что они указаны верно - Dependent variable одна: Blood-pressure и Grouping variable один фактор с тремя градациями: Drug А, В, Saline.

1. Кнопка Summary: Table of statistics (Краткое описание: Таблица статистических данных). Нажимаем её, и видим таблицу с расчётом следующих статистик переменных из каждой группы(А, В, Saline):

Means -Средние арифметические;

N - Объём выборки;

Std.dev - Стандартные отклонения.

-10

2. Кнопка Detailed two-way tables (Подробная таблица сопряжённости). Нажимаем её, и получаем таблицу, в точности совпадающую с Summary: Table of statistics.

-11

В нашем примере это так, и объяснение этого пункта несколько выходит за рамки данной статьи. Однако авансом стоит отметить, что эта таблица просто может содержать полные имена переменных, а не условные обозначения, если таковые имеются.

3. Собственно, сам ANalysis Of VAriance (дисперсионный анализ) - ANOVA. Нажимаем эту кнопку, и получаем готовую таблицу с показателями дисперсионного анализа.

-12

В таблице использованы следующие обозначения:

SS Effect - сумма квадратов отклонений (the Sum of Squared) между группами, которая обычно обозначается как SSB.

df Effect - число степеней свободы (degrees of freedom) для межгрупповой дисперсии: vf = k − 1 = 2;

MS Effect - средняя сумма квадратов межгрупповых отклонений, приходящаяся на одну степень свободы (Mean Squared – средний квадрат). То есть, SS Effect/df Effect = 1026/2;

SS Error - сумма квадратов отклонений (the Sum of Squared) внутри групп, которая обычно обозначается как SSW;

df Error - число степеней свободы для внутригрупповой дисперсии: ve = N − m = 15;

MS Error - средняя сумма квадратов внутригрупповых отклонений, приходящаяся на одну степень свободы (от англ. Mean Squared – средний квадрат). То есть, SS Error/df Error = 239/15;

F - F-критерий Фишера;

p - уровень статистической значимости, по умолчанию принятый меньше 0,05.

!Результаты говорят нам о том, что фактор "вещество" - Drug, оказывает статистически значимое действие (F(2, 15) = 31,35955, p < 0.05) на уровень АД крыс линии SHR!

4. Кнопка Interaction plots (График взаимодействия) позволяет визуально оценить величину независимой переменной Blood-pressure - уровень артериального давления, разделённой на три группы - получается как бы взаимодействие независимой переменной с группирующей.

-13

5. Кнопка Categorized box & whisker plot (Категоризированная диаграмма "ящик-усы"). Также является методом визуальной оценки величины переменных, разделённых на определённое количество групп. В нашем случае - три:

-14

Итак, ответ на вопрос: "Влияет ли фактор Drug на уровень Blood-pressure?", мы получили, и он положителен.

Теперь нам необходимо ответить на вопрос: "какой из препаратов статистически значимо изменяет Blood-pressure, а какой нет?". С этой целью надо провести post hoc тестирование. Для этого перейдём на вкладку Рost-hoc диалогового окна Breakdown & one-way ANOVA:

-15

!Итоговые таблицы ВСЕХ представленных методов выглядят однотипно! Цифрами 1, 2, 3 обозначены средние значения Blood-pressure. Они приведены в шапке таблицы. В ячейке таблицы, на пересечении столбца и строки показан уровень значимости (p) для проверки гипотезы о равенстве двух средних, находящихся на пересечении столбца и строки. Нулевая гипотеза формулируется для двух средних и утверждает, что эти средние равны между собой. Красным показаны случаи, где нулевая гипотеза о равенстве средних отвергается.

Последовательно "пройдёмся" по всем представленным здесь тестам для множественных сравнений.

1. LSD test or planned comparison. Это - тест Фишера на наименьшее значимое различие (Least Significant Difference method, Fisher LSD method).

-16

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению с крысами контрольной группы и с крысами, получавшими препарат В.

2. Scheffe test. Это -метод множественных сравнений Шеффе (Scheffe).

-17

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению с крысами контрольной группы и с крысами, получавшими препарат В.

3. Newman-Keuls test & critical ranges. Это - метод множественных сравнений Ньюмена–Кейлса (Newman-Keuls).

-18

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению с крысами контрольной группы и с крысами, получавшими препарат В.

4. Duncan`s multiple range test & critical ranges. Это - множественные сравнения при помощи рангового критерия Дункана (Duncan`s).

-19

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению с крысами контрольной группы и с крысами, получавшими препарат В.

5. Tukey honest significant difference (HSD). Это - метод множественных сравнений Тьюки, Tukey (или достоверно значимой разности – HSD).

-20

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению как с крысами контрольной группы, так и с крысами, получавшими препарат В. Blood-pressure у животных с препаратом В статистически значимо не отличается от контрольной группы.

6. Tukey HSD for unequal N (Spjovoll-Stoline). Это - unequal N HSD: критерий Тьюки для неравных выборок (критерий Spjovoll-Stoline).

-21

Интерпретация: Blood-pressure у животных, получавших препарат А, статистически значимо меньше по сравнению как с крысами контрольной группы, так и с крысами, получавшими препарат В. Blood-pressure у животных с препаратом В статистически значимо не отличается от контрольной группы.

Таким образом, в приведённом примере мы точно можем сказать, что фактор "вещество" влияет на уровень АД крыс линии SHR в сторону снижения данного показателя. Можно утверждать, что уровень АД животных, которым вводили вещество А, достоверно ниже, чем у тех, кому вводили физ.раствор и вещество В.

!Что же касается вещества В, то мы по-прежнему не можем утверждать, что оно "работает", так как по сравнению с контрольной группой не всегда получается достоверная разница!

В таких случаях обычно рекомендуют проводить исследование повторно, и увеличивать выборку.