Найти в Дзене
medstatistic

Как сравнить средние значения в 2 группах?

Конечно, t-критерием Стьюдента. Вот только у него есть одно важное условие. И нет, это не нормальность распределения, она нас не очень-то волнует, если мы решили сравнивать средние и у нас достаточное число исследуемых. Этим условием является равенство дисперсий показателя в сравниваемых группах. Проще говоря, стандартные отклонения должны быть равны или приблизительно равны. Например, сравнить 15(2) и 17(3), где:
•15 и 17 - средние значения в двух группах,
•2 и 3 - соответствующие стандартные отклонения,
можно с помощью обычного t-критерия Стьюдента. А что делать, если дисперсии двух групп сильно различаются?
Например, показатель составляет 15(2) и 17(6). Одно стандартное отклонение больше другого в 3 раза! Обычный t-критерий в такой ситуации может привести к ошибочной оценке. Особенно если число исследуемых в группах тоже разное. Для обхода условия равенства дисперсий при сравнении средних статистиком Бернардом Льюисом Уэлчем (Bernard Lewis Welch) был разработан модифицированный t-т

Конечно, t-критерием Стьюдента. Вот только у него есть одно важное условие. И нет, это не нормальность распределения, она нас не очень-то волнует, если мы решили сравнивать средние и у нас достаточное число исследуемых.

Этим условием является равенство дисперсий показателя в сравниваемых группах. Проще говоря, стандартные отклонения должны быть равны или приблизительно равны.

Например, сравнить 15(2) и 17(3), где:
•15 и 17 - средние значения в двух группах,
•2 и 3 - соответствующие стандартные отклонения,
можно с помощью обычного t-критерия Стьюдента.

А что делать, если дисперсии двух групп сильно различаются?
Например, показатель составляет 15(2) и 17(6). Одно стандартное отклонение больше другого в 3 раза! Обычный t-критерий в такой ситуации может привести к ошибочной оценке. Особенно если число исследуемых в группах тоже разное.

Для обхода условия равенства дисперсий при сравнении средних статистиком Бернардом Льюисом Уэлчем (Bernard Lewis Welch) был разработан модифицированный t-тест, который получил название t-тест (критерий) Уэлча.

А в связи с тем, что для определения p-значения используется расчет степеней свободы по специальному уравнению Уэлча-Саттертуэйта, иногда этот метод называют t-тест Уэлча-Саттертуэйта (Welch-Satterthwaite t-test) или даже t-тест Саттертуэйта.

Широко известен и довольно популярен такой алгоритм выбора критериев для сравнения средних значений в 2 группах:

1)Проверить равенство дисперсий с помощью специальных тестов, например, теста Левена (Levene’s test).

2)Если дисперсии не имеют статистически значимых различий, использовать t-тест Стьюдента. В противном случае - использовать t-тест Уэлча.
Этот алгоритм реализован в программах SPSS, jamovi, а в PubMed запрос “Levene test” OR “Levene’s test” выдает 647 публикаций, причем 109 из них - этого года.

Вместе с тем, существует и другой алгоритм:

Не проверяя равенство дисперсий, всегда применять t-тест Уэлча для сравнения средних значений.
Указание на этот алгоритм и его обоснование можно найти во многих работах, например,
Lumley T. et al. (2002), Rasch D. et al. (2009), West R.M. (2021).

Например, Rasch D. с соавторами на множестве симуляций показали, что:

Использование пре-тестирования равенства дисперсий не позволяет контролировать вероятность ошибок I рода на нужном уровне (например, 5%), что может сделать вывод о статистической значимости неопределенным.

В случае равных дисперсий t-тесты Уэлча и Стьюдента имеют схожую мощность и дают практически одни и те же результаты.

В случае разных дисперсий t-тест Уэлча имеет преимущество перед t-тестом Стьюдента.

Особенно интересно, что даже при отклонениях от нормального распределения во многих случаях t-тест Уэлча был ещё и надежнее, чем U-критерий Уилкоксона-Манна-Уитни.

Таким образом, использование t-теста Уэлча вместо t-критерия Стьюдента во всех случаях сравнения средних значений в 2 группах является корректным, обоснованным подходом.