Наиболее часто встречаемый в науке подход - это исследование эффектов воздействия на организм животного/человека одного и более (2–3) качественных факторов, имеющих 2 и более уровней (градаций).
И результаты проведённого исследования часто отображаются в виде утверждения: "Влияние фактора Х на признак У". Одна переменная выступает в роли зависимой (variable): признак У; вторая - независимая (группирующая, factor): фактор Х.
Примеры:
- приводят ли лекарства А, Б, В и Г (фактор "препарат") к различному среднему снижению артериального давления у пациентов (переменная);
- как различные уровни УФ-излучения (фактор "уровень УФ-излучения", который может быть низким, средним, высоким...) влияют на образование актинического кератоза (старческого лентиго) (переменная) - отличительной черты фотоповрежденной возрастной кожи;
- оценка влияния на заболеваемость рабочих гастритом (переменная - наличие гастрита) двух факторов: условий труда на рабочих местах (фактор "цех") и общезаводских условий (фактор "№ предприятия").
В таком случае, казалось бы, можно применить такой прекрасный и прозрачный для понимания статистический критерий, как t-критерий Стьюдента! Однако, у t-критерия имеется существенное ограничение: он предназначен только для парных сравнений, то есть ситуации, когда у нас есть только две группы. И в случае, если мы сравниваем более двух групп, попарное сравнение большого количества выборок будет грубой ошибкой, так как в этом случае вступает в силу эффект множественных сравнений. В таком случае гораздо проще использовать критерий, предназначенный для ситуаций, когда имеется много групп, и который даст нам единый ответ на все изучаемые группы — дисперсионный анализ (ANOVA).
ANOVA - излюбленный инструмент анализа научных данных, а также данных в области фармакологии и маркетинга. Собственно, он был разработан Роналдом Фишером именно для анализа результатов экспериментальных исследований. ANOVA - это акроним от ANalysis Of VAriance (дисперсионный анализ).
Итак, ANOVA позволяет анализировать влияние различных факторов на исследуемую переменную. В зависимости от количества факторов, влияние которых на переменную или результирующий признак изучается, выделяют однофакторный и многофакторный дисперсионный анализ. В том случае, если изучается влияние факторов на более чем одну независимую переменную,
характеризующую объект исследования, используют многомерную версию дисперсионного анализа. Для анализа влияния различных уровней фактора на один и тот же объект (зависимые выборки) разработан дисперсионный анализ с повторными измерениями. В программе STATISTICA реализованы все эти варианты, а также многие другие)
Для простоты и наглядности мы рассмотрим однофакторный дисперсионный анализ.
Пример. На трёх группах крыс линии SHR изучали влияние соединений А и В в условиях многодневного введения на уровень АД (артериального давления). Контрольной группе вводили раствор натрия хлорида 0,9 % изотонический. После месячного курса инъекций оказалось, что уровни среднего АД составляли:
- в I группе (контроль, n1 = 5) — 185, 187, 190, 193, 195 мм рт.ст.;
- во II группе (в-во А, n2 = 7) — 165, 168, 172, 173, 175, 175, 178 мм рт.ст.;
- в III группе (в-во В, n3 = 6) — 180, 182, 183, 185, 186, 189 мм рт.ст.
Общий объём выборки n = 18.
Крысы со спонтанной гипертензией (Spontaneously Hypertensive Rat, SHR) - это лабораторные крысы, которые являются животной моделью первичной гипертензии, используемой для изучения сердечно-сосудистых заболеваний. Это наиболее изученная модель гипертонии, измеряемая по количеству публикаций. Линия SHR была получена в 1960-х годах Окамото и его коллегами, которые начали селекционировать крыс линии Вистар-Киото с высоким кровяным давлением.
В соответствие с планом эксперимента, такие данные следует обрабатывать с помощью однофакторной ANOVA. Зависимой переменной здесь является "уровень АД", независимой (группирующей) - "вещество".
Формулируем гипотезу. Нулевая гипотеза состоит в том, что крысы линии SHR и 1-ой, и 2-ой, и 3-ей группы - абсолютно не различаются между собой по уровню АД. Альтернативная гипотеза – уровень АД животных хотя бы одной группы значимо отличается от этого показателя в остальных группах. Альтернативная гипотеза, применяемая для ANOVA, - сложная гипотеза (omnibus hypothesis). Она включает в себя много маленьких гипотез:
Мы отвергаем общую нулевую гипотезу Н0, если верна хотя бы одна из маленьких частных альтернативных гипотез (парных или комплексных). Но какая именно – ANOVA не говорит.
Разнообразие признака, который интересует нас в исследовании, складывается из двух вещей. А) из принадлежности объекта исследования к определённой выборке (группе), которая возникла благодаря действию фактора (группирующей переменной). Это называется систематической (межгрупповой, или факториальной) дисперсией. Б) из разнообразия внутри выборки, которое возникло там вследствие влияния абсолютно «левых» факторов. Это называется случайной (внутригрупповой) дисперсией.
Суть дисперсионного анализа состоит в определении соотношения систематической (межгрупповой) дисперсии к случайной (внутригрупповой, остаточной) дисперсии в измеряемых данных. Иными словами, сравнить между собой их вклады!
Хорошо знакомая нам дисперсия - одна из основных мер, определяющих разнообразие, И дисперсионный анализ работает именно с ней.
Поэтому, очевидно, что первым шагом будет расчёт среднего значения для каждой группы.
Среднее АД для I группы = 190 мм рт.ст.;
Среднее АД для II группы = 172 мм рт.ст.;
Среднее АД для III группы = 184 мм рт.ст.
Среднее АД для (I +II + III) группы = 181 мм рт.ст.
Второй шаг: рассчитать сумму квадратов между группами (SSB) по формуле:
Третий шаг: рассчитать сумму квадратов внутри групп (SSW) по формуле:
Четвёртый шаг: рассчитать F-статистику
Это делается путём деления межгрупповой дисперсии (SSB) на внутригрупповую дисперсию (SSW):
F = (SSB / (k - 1)) / (SSW / (n - k)) = (1026 / (3 - 1)) / (239 / (18 - 3)) = 32,2642
где k - число групп (k = 3), а n - общий объем выборки (n = 18).
Пятый шаг: сравнить рассчитанную F-статистику с критическим значением F. Определим критическое значение F, исходя из желаемого уровня значимости (p < 0,05) и степеней свободы.
Степень свободы для межгрупповой дисперсии: vf = k − 1 = 2;
Степень свободы для внутригрупповой дисперсии: ve = N − m = 15.
В таблице критических значений найдём значение на пересечении числа степеней свободы для межгрупповой дисперсии и внутригрупповой дисперсии:
Сравниваем полученное значение F-статистики (32,2642) с критическим при р=0,05 значением, указанным в таблице: 3,68. Рассчитанное значение F достаточно большое, и значительно превышает критическое.
В научных статьях результаты дисперсионного анализа указывают следующим образом: фактор "вещество" оказывает статистически значимое действие (F(2, 15) = 32,26, p < 0.05) на уровень АД крыс линии SHR.
Итак, исследование влияния соединений А и В в условиях многодневного введения на уровень АД показал, что факториальная дисперсия статистически значимо (p < 0,05) превышает остаточную дисперсию. Следовательно, нулевую гипотезу о том, что препараты не влияют на АД, следует отвергнуть.
Мы также можем вычислить силу влияния фактора "вещество" по методу Плохинского:
Теперь мы можем сделать вывод о том, что, 81 % общей дисперсии комплекса можно объяснить влиянием препаратов.
Ошибка силы влияния фактора "вещество" составляет:
Условия применения дисперсионного анализа (ANOVA):
Перед тем как приступить к применению дисперсионного анализа, необходимо убедиться в соблюдении ряда условий:
- данные - количественные;
- данные распределены по закону нормального распределения;
- примерно равные значения дисперсий двух выборок, которые мы сравниваем.
Эти пункты совпадают с условиями применения статистического критерия t-теста. А эти отличаются:
- ANOVA используется для сравнения трёх или более групп, однако для анализа одного фактора в двух его градациях не возбраняется использовать критерий Стьюдента. В этом случае он даст такие же результаты, что и дисперсионный анализ.
- Если мы не рассматриваем применение дисперсионного анализа (ANOVA) с повторными измерениями, то для применения ANOVA выборки должны быть независимы между собой.
Таким образом, дисперсионный анализ даёт ответ на вопрос: "влияет ли изучаемый фактор на результирующий признак?". Однако исследователя, как правило, интересует вопрос: "есть ли различия между действием различных факторов/градаций фактора"? В приведённом выше примере это вопрос: "какой из препаратов статистически значимо изменяет АД, а какой нет?". С этой целью проводят так называемое "post hoc тестирование", которое определяет, какие именно группы значимо отличаются друг от друга.