Критерий Вилкоксона - это общее название для двух связанных между собой непараметрических статистических критериев, используемых для сравнения двух групп. Он является альтернативой t-критерию Стьюдента, когда данные не соответствуют требованиям нормальности распределения или когда данные представлены в порядковой шкале (ранги).
Существует два основных критерия Вилкоксона:
- Критерий Вилкоксона для связанных выборок (Signed-Rank Test): Используется для сравнения двух зависимых выборок (например, измерения одного и того же параметра до и после воздействия, или сравнение результатов двух связанных групп, например, близнецов). Он проверяет, есть ли существенная разница между двумя наборами измерений внутри каждой пары.
- Критерий Вилкоксона для независимых выборок (Rank-Sum Test, также известен как критерий Манна-Уитни): Используется для сравнения двух независимых выборок. Он проверяет, являются ли две выборки взятыми из одной и той же популяции или распределены одинаково.
Разберем каждый из них подробнее:
1. Критерий Вилкоксона для связанных выборок (Signed-Rank Test):
- Когда используется:Для сравнения двух связанных выборок (например, “до и после”).
Данные имеют порядковую шкалу (ранги) или не соответствуют требованиям нормальности. - Гипотезы:Нулевая гипотеза (H0): Разница между двумя наборами измерений симметрична относительно нуля (т.е., нет существенной разницы между двумя группами).
Альтернативная гипотеза (H1): Разница между двумя наборами измерений не симметрична относительно нуля (т.е., есть существенная разница между двумя группами). Альтернативная гипотеза может быть односторонней (разница в одну сторону) или двухсторонней (разница в любую сторону). - Процедура:Вычислить разницу между каждой парой значений (d = значение “после” - значение “до”).
Отбросить пары, для которых разница равна нулю (d = 0).
Присвоить ранги абсолютным значениям разностей (от меньшего к большему). Если есть одинаковые разности, присвоить им средний ранг.
Суммировать ранги положительных разностей (W+) и ранги отрицательных разностей (W-).
Вычислить тестовую статистику (T): T = min(W+, W-).
Сравнить полученную статистику T с критическим значением из таблицы распределения Вилкоксона для связанных выборок (или рассчитать p-значение).
Принять решение: Если T меньше критического значения (или p-значение меньше уровня значимости α), то нулевая гипотеза отвергается, и делается вывод о наличии статистически значимой разницы между двумя группами. - Пример: Оценка уровня тревожности пациентов до и после курса психотерапии.
2. Критерий Вилкоксона для независимых выборок (Rank-Sum Test / Манна-Уитни):
- Когда используется:Для сравнения двух независимых выборок.
Данные имеют порядковую шкалу (ранги) или не соответствуют требованиям нормальности. - Гипотезы:Нулевая гипотеза (H0): Две выборки взяты из одной и той же популяции (или распределены одинаково).
Альтернативная гипотеза (H1): Две выборки взяты из разных популяций (или распределены по-разному). Альтернативная гипотеза может быть односторонней (одна группа имеет более высокие значения, чем другая) или двухсторонней (группы различаются, но направление различия не определено заранее). - Процедура:Объединить обе выборки в одну.
Присвоить ранги всем значениям в объединенной выборке (от меньшего к большему). Если есть одинаковые значения, присвоить им средний ранг.
Суммировать ранги значений, принадлежащих к каждой из двух исходных выборок (R1 и R2).
Вычислить тестовую статистику (U):U1 = n1n2 + (n1(n1+1))/2 - R1
U2 = n1n2 + (n2(n2+1))/2 - R2
U = min(U1, U2), где n1 и n2 - размеры первой и второй выборки соответственно.
Сравнить полученную статистику U с критическим значением из таблицы распределения Манна-Уитни (или рассчитать p-значение).
Принять решение: Если U меньше критического значения (или p-значение меньше уровня значимости α), то нулевая гипотеза отвергается, и делается вывод о наличии статистически значимой разницы между двумя группами. - Пример: Сравнение эффективности двух разных методов обучения.
Важные замечания:
- Поправка на связки: При наличии большого количества одинаковых значений (связок) в данных рекомендуется применять поправку на связки при расчете тестовой статистики.
- Нормальное приближение: При больших размерах выборок (обычно n > 20) можно использовать нормальное приближение для расчета p-значения.
- Выбор критерия: Правильный выбор критерия Вилкоксона (для связанных или независимых выборок) зависит от структуры данных и характера исследуемого вопроса.
- Программное обеспечение: Расчет критериев Вилкоксона обычно выполняется с использованием статистического программного обеспечения (например, SPSS, R, Python).
Критерии Вилкоксона являются мощными и широко используемыми непараметрическими тестами для сравнения двух групп. Они особенно полезны, когда данные не соответствуют требованиям параметрических тестов, таких как t-критерий Стьюдента.