В качестве примера рассмотрим данные исследования, которые уже рассматривались в предыдущей статье.
Имеется 4 группы крыс - крысы Wistar, которым вводили физ. раствор (WS + Vehicle), крысы Wistar, которым вводили предшественник дофамина - L-DOPA (WS + L-DOPA), крысы линии WAG/Rij, которым вводили физ. раствор (WR + Vehicle) и крысы линии WAG/Rij, которым вводили L-DOPA (WR + L-DOPA). Эти группы сравнивали между собой по показателю T(pass) (время пассивного плавания) - основной показатель в тесте принудительного плавания. Считается, что высокие значения T(pass) свойственны для депрессивно-подобного поведения у грызунов. Снижение T(pass) характерно для экспериментальной ситуации с введением антидепрессантов или веществ с антидепрессантно-подобной активностью.
Данные по времени пассивного плавания (T(pass)) представлены в программе STATISTICA в виде таблицы с тремя столбцами:
- в столбце (1) находиться группирующая переменная (фактор "Линия крыс", Strain) с соответствующими двумя градациями - WS (Wistar) и WR (WAG/Rij);
- в столбце (2) находиться группирующая переменная (фактор "вещество", Drug) с соответствующими двумя градациями - Vehicle (Физ. раствор, Контрольная группа) и L-DOPA (Экспериментальная группа);
- в столбце (3) находятся числовые значения зависимой переменной T(pass) (Время пассивного плавания).
Итого 40 наблюдений: 10 животных в каждой из 4 групп - WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA.
Чтобы обработать эти данные, нам необходим двухфакторный дисперсионный анализ (two-way ANOVA). Для этого в главном меню необходимо нажать на вкладку Statistics (Статистики), и войти в модуль ANOVA (Analysis of variance, дисперсионный анализ).
Из открывшегося списка выбрать пункт Factorial ANOVA (Факторный дисперсионный анализ). Нажать Ок:
Перед нами появляется диалоговое окно Factorial ANOVA, по умолчанию открытое на вкладке Quick (Быстро). Нажав на кнопку Variable (Переменные), мы переходим в поле выбора переменных. Выбирается зависимая переменная (Dependent variable list) и группирующая переменная (Categorial predictors (factors)). Группирующей переменной в нашем примере являются две независимые переменные - Strain и Drug. С их помощью значения зависимой переменной T(pass) группируются, исходя из того, крысам какой линии, Strain, какое вещество, Drug, мы вводили.
Нажимаем на ОК. Переходим обратно в диалоговое окно Factorial ANOVA. Убедимся, что что переменные указаны верно. Под копкой Variable указано, что в роли Dependent variable - T(pass), а Categorial factors - это Strain-Drug.
Нажав на кнопку Factor Codes, мы указываем программе, что необходимо проанализировать все экспериментальные группы. Для этого мы нажимаем All, в поле отображаются все градации группирующих переменных: Strain (WS - WR) и Drug (Vehicle - L-DOPA). Нажимаем ОК.
В результате появится окно с 8 вкладками, автоматически открытое на вкладке Quick (Быстро), и 6 кнопками.
1. Кнопка All effects/Graphs позволяет увидеть, как соотносятся средние указанных групп.
- Если мы отмечаем Strain (выборка разделена только с учётом фактора Линия крыс без учёта фактора Вещество) и устанавливаем флажок Graph, мы видим график. Над графиком указывается число степеней свободы, а также значения F и p для рассматриваемого фактора: F (1, 36) = 27,208, p < 0,001.
Когда мы устанавливаем флажок Spreesheet, то помимо всего, что мы уже видели на графике, здесь есть ещё: среднее T(pass) Mean, стандартная ошибка St. err. T(pass), доверительный интервал (95% confidence limits of mean) принятый по умолчанию за 95% и количество значений переменной N.
- Если мы отмечаем Drug (выборка разделена только с учётом фактора Вещество без учёта фактора Линия крыс) и устанавливаем флажок Graph или Spreesheet, получим аналогичные результаты с аналогичной интерпретацией, только для фактора Drug:
- Если мы отмечаем последнюю строчку, сочетание факторов Strain х Drug, мы получаем данные для каждой из 4 ячеек: WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA
Устанавливаем флажок Graph. Нажимаем Ок, и попадаем в поле выбора переменных, отображённых на оси абсцисс Х, и тех, которые сравниваются между собой и обозначены разными графиками (и цветами). Сначала на оси Х отложим WS и WR, сравнивая их между собой с введённым физ. раствором (синий график), или L-DOPA (красный график). Потом поменяем местами: по оси Х отложим Vehicle, и L-DOPA.
Устанавливаем флажок Spreesheet, и получаем таблицу с такими же столбцами, как и для факторов Strain и Drug по отдельности, только строк будет 4 - соответствующе каждой нашей ячейке.
2. Нажав на кнопку All effects (ANOVA), мы получаем таблицу с показателями двухфакторного дисперсионного анализа.
Что есть что в этой таблице?
В первой строке приведены данные по показателю Intercept (Свободный член). Он связан с разложением суммы квадратов всех значений данных. Указанное для Intercept значение критерия F получено путем деления MSIntercept/MSError = 1312613 / 781 = 1680,443.
Три строчки между Intercept и Error - расчёты для факторов Strain, Drug и их взаимодействия Strain х Drug.
- SS, или SSB - сумма квадратов отклонений (the Sum of Squared) между группами.
- Degr.of Freedom - число степеней свободы (degrees of freedom) для межгрупповой дисперсии;
- MS - средняя сумма квадратов межгрупповых отклонений, приходящаяся на одну степень свободы (Mean Squared – средний квадрат). То есть, SS Effect/df Effect = 1026/2;
- F - F-критерий Фишера;
- p - уровень статистической значимости, по умолчанию принятый меньше 0,05.
Последняя строка, Error (Ошибка), посвящена показателям внутригрупповой дисперсии, и содержит:
- SS Error, или SSW - сумма квадратов отклонений (the Sum of Squared) внутри групп;
- df Error - число степеней свободы для внутригрупповой дисперсии;
- MS Error - средняя сумма квадратов внутригрупповых отклонений, приходящаяся на одну степень свободы (от англ. Mean Squared – средний квадрат).
Расчёты и формулы для этой таблицы приведены в предыдущей статье.
* В научных статьях значимость факторов указывают примерно так: "Для времени пассивного плавания по данным двухфакторного дисперсионного анализа значимыми является факторы "линия крыс" (F (1, 36) = 27.28, p < 0.001) и "вещество" (F (1, 36) = 48.74, p < 0.001), а также взаимодействие этих двух факторов "линия крыс" х "вещество" (F (1, 36) = 52.60, p < 0.001)".
3. Итак, если факторы Strain и Drug, а также их сочетание Strain х Drug - значимы, то может казаться, что между всеми группами (WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA ) точно есть статистически значимые различия по показателю T(pass). Это не так! Необходимо провести post hoc тестирование, чтобы найти, между какими из 4 групп есть значимые отличия. Для этого нажмём на кнопку More results...
Перейдём на вкладку Рost-hoc появившегося диалогового окна:
Не будем использовать все методы, остановимся на методе множественных сравнений Ньюмена–Кейлса (Newman-Keuls). Нажмём соответствующую кнопку, и получим итоговую таблицу данного метода:
Объяснение и интерпретация - в точности как здесь. Наши результаты говорят о том, что показатель T(pass) у группы WR + L-DOPA меньше, чем у всех групп, с которыми её можно сопоставить: WS + L-DOPA и WR + Vehicle.
** В научных статьях это обычно формулируют так: "У крыс линии WAG/Rij через 24 часа после введения L-ДОФА время пассивного плавания (95.20 ± 8.84) значимо больше по сравнению с данным показателем у крыс линии WAG/Rij через 24 часа после введения физ.раствора (221.00 ± 8.84) в 2.32 раза (p < 0.001), а также у крыс Wistar, которым вводили L-ДОФА (0.08 ± 0.04), в 2.16 раз (p < 0.001)".