Критерий Манна-Уитни (U-критерий Манна-Уитни, Mann-Whitney U test) – это непараметрический статистический тест, который используется для сравнения двух независимых выборок по количественному признаку. В отличие от t-критерия Стьюдента, критерий Манна-Уитни не требует нормального распределения данных и применяется, когда данные измерены в ранговой шкале или когда нарушены условия применимости t-критерия.
I. Суть критерия Манна-Уитни:
- Цель: Определение, различаются ли статистически значимо два набора данных, измеренных по крайней мере в порядковой шкале. Он проверяет гипотезу о том, что две выборки взяты из одной и той же популяции.
- Основная идея: Критерий Манна-Уитни оценивает, насколько часто значения одной выборки превышают значения другой выборки. Если значения одной выборки систематически выше, чем значения другой выборки, то можно сделать вывод о статистически значимом различии между двумя группами.
- Преимущества: Не требует нормального распределения данных, устойчив к выбросам, может использоваться для малых выборок.
II. Условия применения критерия Манна-Уитни:
- Две независимые выборки: Данные должны быть получены из двух независимых групп (например, экспериментальная группа и контрольная группа).
- Измерение в ранговой шкале: Данные должны быть измерены по крайней мере в ранговой (порядковой) шкале, то есть значения можно упорядочить по возрастанию или убыванию.
- Отсутствие нормального распределения: Критерий Манна-Уитни особенно полезен, когда данные не имеют нормального распределения, что делает невозможным применение параметрических тестов, таких как t-критерий Стьюдента.
III. Этапы проведения критерия Манна-Уитни:
- Формулирование гипотез:Нулевая гипотеза (H0): Распределения признака в обеих выборках одинаковы (между выборками нет статистически значимых различий).
Альтернативная гипотеза (H1): Распределения признака в обеих выборках различны (между выборками есть статистически значимые различия). Альтернативная гипотеза может быть односторонней (например, значения в одной выборке больше, чем в другой) или двусторонней (значения в выборках просто различаются). - Объединение выборок и ранжирование:Объедините значения обеих выборок в одну общую выборку.
Упорядочите все значения объединенной выборки по возрастанию или убыванию.
Присвойте каждому значению ранг (порядковый номер) в объединенной выборке.
Если есть одинаковые значения (связанные ранги), присвойте им средний ранг. Пример: Если два значения занимают 5-е и 6-е места, присвойте им обоим ранг (5+6)/2 = 5,5. - Вычисление ранговых сумм:Разделите объединенную выборку обратно на исходные две выборки.
Вычислите сумму рангов для каждой выборки. Обозначим сумму рангов для первой выборки как R1, а для второй выборки как R2. - Вычисление U-статистики:
Вычислите U-статистику для каждой выборки по формулам:U1 = n1 * n2 + (n1 * (n1 + 1)) / 2 - R1
U2 = n1 * n2 + (n2 * (n2 + 1)) / 2 - R2
Где:n1 – размер первой выборки.
n2 – размер второй выборки.
R1 – сумма рангов первой выборки.
R2 – сумма рангов второй выборки.
Выберите наименьшее из двух значений U: U = min(U1, U2). - Определение уровня значимости (p-value):Сравните полученное значение U с критическим значением U-критерия, которое можно найти в специальных таблицах для заданного уровня значимости (обычно 0,05 или 0,01) и размеров выборок n1 и n2.
Или, что более удобно, используйте статистические программы (например, SPSS, R, Python) для автоматического вычисления p-value. - Принятие решения:Если U меньше критического значения (или p-value меньше заданного уровня значимости), то отвергается нулевая гипотеза H0, и принимается альтернативная гипотеза H1. Это означает, что между выборками есть статистически значимые различия.
Если U больше или равно критическому значению (или p-value больше или равно заданному уровню значимости), то нет оснований отвергать нулевую гипотезу H0. Это означает, что между выборками нет статистически значимых различий.
IV. Пример:
Допустим, мы хотим сравнить эффективность двух методов обучения чтению у детей. Мы случайным образом разделили детей на две группы: группа A (новый метод) и группа B (традиционный метод). После курса обучения мы оценили уровень чтения каждого ребенка по шкале от 1 до 10.
Результаты:
- Группа A: 7, 8, 9, 6, 8
- Группа B: 5, 6, 7, 4, 5
- Гипотезы:H0: Методы обучения чтению не различаются по эффективности.
H1: Новый метод обучения чтению более эффективен, чем традиционный. - Объединение выборок и ранжирование:
- Вычисление ранговых сумм:
- R1 (сумма рангов группы A) = 4.5 + 6.5 + 8.5 + 8.5 + 10 = 38
- R2 (сумма рангов группы B) = 1 + 2.5 + 2.5 + 4.5 + 6.5 = 17
- Вычисление U-статистики:
- n1 = 5 (размер группы A)
- n2 = 5 (размер группы B)
- U1 = 5 * 5 + (5 * (5 + 1)) / 2 - 38 = 25 + 15 - 38 = 2
- U2 = 5 * 5 + (5 * (5 + 1)) / 2 - 17 = 25 + 15 - 17 = 23
- U = min(2, 23) = 2
- Определение уровня значимости (p-value):
- Используя таблицы U-критерия или статистическую программу, находим, что для n1 = 5, n2 = 5 и U = 2, p-value = 0.039 (односторонний тест).
- Принятие решения:
- Поскольку p-value (0.039) меньше заданного уровня значимости (0.05), мы отвергаем нулевую гипотезу H0 и принимаем альтернативную гипотезу H1.
- Вывод: Новый метод обучения чтению статистически значимо более эффективен, чем традиционный метод.
V. Преимущества критерия Манна-Уитни:
- Непараметрический: Не требует нормального распределения данных.
- Прост в применении: Легко вычисляется вручную или с помощью статистических программ.
- Устойчив к выбросам: Выбросы в данных оказывают меньшее влияние на результат, чем в параметрических тестах.
- Подходит для малых выборок: Может использоваться, когда размер выборок невелик.
VI. Ограничения критерия Манна-Уитни:
- Меньшая мощность: По сравнению с параметрическими тестами, критерий Манна-Уитни обладает меньшей статистической мощностью, то есть с меньшей вероятностью обнаруживает существующие различия между группами.
- Применимость к ранговым данным: Критерий Манна-Уитни предназначен для данных, измеренных в ранговой шкале. Если данные измерены в интервальной или относительной шкале и имеют нормальное распределение, то более предпочтительным является использование t-критерия Стьюдента.
VII. Использование в статистических программах:
Критерий Манна-Уитни легко реализуется в большинстве статистических программ, таких как SPSS, R, Python (Scipy), Excel (с использованием надстроек). В этих программах достаточно указать две выборки, и программа автоматически вычислит U-статистику и p-value.
VIII. Заключение:
Критерий Манна-Уитни – это полезный инструмент для сравнения двух независимых выборок, когда данные не имеют нормального распределения или измерены в ранговой шкале. Он позволяет определить, есть ли статистически значимые различия между двумя группами, и широко используется в различных областях науки и практики.