Многофакторный дисперсионный анализ (многофакторная ANOVA) позволяет исследовать влияние двух и более независимых факторов на зависимую переменную, а также изучать взаимодействие между этими факторами. Это существенно расширяет аналитические возможности по сравнению с однофакторным анализом. Поэтому многофакторная ANOVA находит максимально широкое применение, пожалуй, во всех сферах: медицинские и научные исследования, психология и маркетинг!
Порядок проведения расчётов в случае многофакторного дисперсионного анализа и условия его применения полностью совпадают с однофакторным, за исключением некоторых деталей, о которых будет сказано далее.
Для простоты и наглядности рассмотрим двухфакторный дисперсионный анализ (two-way ANOVA). Как следует из названия, этот анализ изучает влияние двух факторов (и их взаимодействия) на зависимую переменную.
Примеры: влияние пола и возраста на реакцию на лекарство; влияние веса и уровня холестерина на величину артериального давления; влияние показателей долгосрочной памяти и уровня удовлетворённости жизнью на выбор цвета в тесте Люшера у студентов одной группы.
Рассмотрим пример из одного реального исследования: крыс Wistar и крыс линии WAG/Rij разделили на группы, одной из которых (экспериментальная группа) однократно вводили предшественник дофамина - L-ДОФА, контрольная группа получала эквивалентный объём физ. раствора. Итого получилось 4 группы, которые необходимо сравнить между собой в тесте принудительного плавания, основной показатель которого - время пассивного плавания T(pass).
Крысы линии WAG/Rij являются валидной генетической моделью депрессии, ассоциированной с абсанс-эпилепсией. Основной признак абсанс-эпилепсии – наличие спонтанных генерализованных пик-волновых разрядов на ЭЭГ, которые сопровождаются отсутствием реагирования на внешние стимулы. Первые одиночные ПВР появляются у крыс линии WAG/Rij примерно в возрасте 2-3 месяцев, а к 5-6-месячному возрасту число и длительность ПВР увеличиваются.
По мере усиления пик-волновой активности у крыс линии WAG/Rij формируется ярко выраженное депрессивно-подобное поведение, одним из маркёров которого является увеличенный период пассивного плавания в тесте вынужденного плавания [Sarkisova, van Luijtelaar, 2011].
Тест принудительного (вынужденного) плавания является одним из наиболее широко используемых для определения уровня депрессивности у животных и оценки антидепрессантной активности фармакологических препаратов. Данная методика была введена в научную практику R.D. Porsolt в 1977 году [Porsolt et al., 1977].
Данные, накопленные к настоящему времени, свидетельствуют о том, что нейрохимической основой как абсанс-эпилепсии, так и коморбидной депрессии, является гипофункция дофаминергической (ДА-) системы мозга у крыс линии WAG/Rij. Так, у “депрессивных” крыс линии WAG/Rij было обнаружено пониженный по сравнению с “нормальными” крысами Wistar уровень ДА и/или его метаболитов в прилежащем ядре, префронтельной коре и стриатуме, а также повышенная плотность D2-подобных ДА-рецепторов в прилежащем ядре и вентральной области покрышки [Sarkisova et al., 2014].
Предполагалось, что повышение «тонуса» ДА-системы, вызванное предшественником ДА - L-ДОФА, снизит период пассивного плаванияи увеличит время активного плавания в тесте вынужденного плавания у крыс линии WAG/Rij. Контролями служили крысы Wistar.
Данные по показателю "время пассивного плавания" (T(pass)) представлены в виде таблицы с тремя столбцами:
- Фактор Strain (Линия крыс): WS (Wistar) и WR (WAG/Rij).
- Фактор Drug (Препарат): Vehicle, Veh (Физ. раствор, Контрольная группа) и L-DOPA, LD (Экспериментальная группа).
- T(pass) (Время пассивного плавания): числовые значения зависимой переменной.
Итого 40 наблюдений: 10 животных в каждой из 4 групп - WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA.
1. Сформулируем гипотезы:
2. Найдём средние значения и стандартные отклонения по каждой из 4 групп: WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA. Представим их сразу в виде таблицы:
Сложим средние по каждой из 4 групп, чтобы получить общее среднее:
3. Рассчитаем Сумму Квадратов Внутри Групп (SSW). Её часто называют Суммой Квадратов Ошибки (SS Error, или SSE). Формула стандартная:
Сначала рассчитывают SSE для каждой из 4 групп - это сумма квадратов отклонений внутри каждой из 4 групп (ячеек) от среднего этой ячейки. Ячейкой часто называют группы, в нашем случае одна из четырёх: WS + Vehicle, WS + L-DOPA, WR + Vehicle и WR + L-DOPA.
4. Рассчитаем Cумму Квадратов Между Группами (SSB) по формуле:
- Сумма Квадратов Фактора "Линия крыс" (Strain), SSB (Strain)
Средние для каждой из линий крыс, WS или WR (без учёта действия вещества):
SSB (Strain) = 10 ⋅ 2 ⋅ [(204,2 − 180,9)2 + (157,6 − 180,9)2] = 20 ⋅ [(23,3)2 + (−23,3)2] = 20 ⋅ (542,89 + 542,89) = 20 ⋅ 1085,78 = 21715,6
- Сумма Квадратов Фактора "Вещество" (Drug), SSB (Drug)
Средние для каждого из вводимых веществ, Veh илиLD (без учёта линии крыс):
SSB (Drug) = 10 ⋅ 2 ⋅ [(211,5 − 180,9)2 + (150,3 − 180,9)2] = 20 ⋅ [(30,6)2 + (−30,6)2] = 20 ⋅ (936,36 + 936,36) = 20 ⋅ 1872,72 = 37454,4
- Сумма Квадратов Взаимодействия SSB (Strain)х(Drug)
По сути это и есть самая главная особенность многофакторной ANOV`ы, которая отличает её от однофакторной. Сумма Квадратов Взаимодействия Факторов не равна сумме изменчивостей между уровнями фактора "Линия крыс" и "Вещество". Эта разница определяется взаимодействием этих факторов и рассчитывается по формуле:
Рассчитаем отклонение для каждой ячейки от суммы основных эффектов:
Подставим эти значению в формулу:
SSB(Strain x Drug) = 10 ⋅ [(−31,8)2 + (31,8)2 + (31,8)2+(−31,8)2] = 10 ⋅ 4 ⋅ (31,8)2 = 40 ⋅ 1011,24 = 40449,6
Рассчитаем полную Сумму Квадратов:
SS = SSB(Strain)+ SSB(Drug)+SSB(Strain x Drug)+SS Error = 21715.6 + 37454.4 + 40449.6 + 27884.92 = 127504.52
5. Рассчитаем степени свободы:
df(Strain) = Strain − 1 = 2 − 1 = 1
df(Drug) = Drug − 1 = 2 − 1 = 1
df(Strain x Drug) = (Strain − 1) ⋅ (Drug − 1) = 1 ⋅ 1 = 1
df Error = N − число ячеек = 40 − 4 = 36
df=N−1=39
6. Рассчитаем Средние Квадраты (MS):
7. Наконец, приступаем к расчёту F-статистик:
- F по фактору Strain:
- F по фактору Drug:
- F по сочетанию факторов Strain x Drug:
8. Интерпретация (при α = 0.05)
Для df (по Факторам)= 1 и df Error = 36, критическое значение F crit составляет приблизительно 4,11.
- Эффект фактора Strain: F(Strain) ≈ 28,03 > 4,11. Значимо; отвергаем нулевую гипотезу. Существует статистически значимая разница в средних значениях T(pass) между линиями WS и WR.
- Эффект фактора Drug: F(Drug) ≈ 48,35 > 4,11. Значимо; отвергаем нулевую гипотезу. Существует статистически значимая разница в средних значениях T(pass) между группами, которым вводили физ. раствор (Vehicle) и L-DOPA.
- Эффект взаимодействия факторов Strain x Drug: F(Strain x Drug) ≈ 52,22 > 4,11. Очень значимо; тем более отвергаем нулевую гипотезу! Это самый важный вывод: эффект введения предшественника ДА - L-DOPA, зависит от того, крыс какой линии мы рассматриваем.
* Как и в случае однофакторного дисперсионного анализа, двухфакторная ANOVA не может сама по себе ответить на вопрос: "Есть ли значимые различия T(pass), полученные из тестирования крыс каждой из 4 групп". Чтобы точно определить, какие именно пары групп (ячеек) отличаются друг от друга, следует использовать один или несколько post-hoc тестов.