1696 подписчиков

Критерий манна уитни

21 марта 202521 мар 2025

5 мин

Критерий Манна-Уитни (U-критерий Манна-Уитни, Mann-Whitney U test) – это непараметрический статистический тест, который используется для сравнения двух независимых выборок по количественному признаку. В отличие от t-критерия Стьюдента, критерий Манна-Уитни не требует нормального распределения данных и применяется, когда данные измерены в ранговой шкале или когда нарушены условия применимости t-критерия. I. Суть критерия Манна-Уитни: II. Условия применения критерия Манна-Уитни: III. Этапы проведения критерия Манна-Уитни: IV. Пример: Допустим, мы хотим сравнить эффективность двух методов обучения чтению у детей. Мы случайным образом разделили детей на две группы: группа A (новый метод) и группа B (традиционный метод). После курса обучения мы оценили уровень чтения каждого ребенка по шкале от 1 до 10. Результаты: V. Преимущества критерия Манна-Уитни: VI. Ограничения критерия Манна-Уитни: VII. Использование в статистических программах: Критерий Манна-Уитни легко реализуется в большинстве с

I. Суть критерия Манна-Уитни:

Цель: Определение, различаются ли статистически значимо два набора данных, измеренных по крайней мере в порядковой шкале. Он проверяет гипотезу о том, что две выборки взяты из одной и той же популяции.
Основная идея: Критерий Манна-Уитни оценивает, насколько часто значения одной выборки превышают значения другой выборки. Если значения одной выборки систематически выше, чем значения другой выборки, то можно сделать вывод о статистически значимом различии между двумя группами.
Преимущества: Не требует нормального распределения данных, устойчив к выбросам, может использоваться для малых выборок.

II. Условия применения критерия Манна-Уитни:

Две независимые выборки: Данные должны быть получены из двух независимых групп (например, экспериментальная группа и контрольная группа).
Измерение в ранговой шкале: Данные должны быть измерены по крайней мере в ранговой (порядковой) шкале, то есть значения можно упорядочить по возрастанию или убыванию.
Отсутствие нормального распределения: Критерий Манна-Уитни особенно полезен, когда данные не имеют нормального распределения, что делает невозможным применение параметрических тестов, таких как t-критерий Стьюдента.

III. Этапы проведения критерия Манна-Уитни:

Формулирование гипотез:Нулевая гипотеза (H0): Распределения признака в обеих выборках одинаковы (между выборками нет статистически значимых различий).
Альтернативная гипотеза (H1): Распределения признака в обеих выборках различны (между выборками есть статистически значимые различия). Альтернативная гипотеза может быть односторонней (например, значения в одной выборке больше, чем в другой) или двусторонней (значения в выборках просто различаются).
Объединение выборок и ранжирование:Объедините значения обеих выборок в одну общую выборку.
Упорядочите все значения объединенной выборки по возрастанию или убыванию.
Присвойте каждому значению ранг (порядковый номер) в объединенной выборке.
Если есть одинаковые значения (связанные ранги), присвойте им средний ранг. Пример: Если два значения занимают 5-е и 6-е места, присвойте им обоим ранг (5+6)/2 = 5,5.
Вычисление ранговых сумм:Разделите объединенную выборку обратно на исходные две выборки.
Вычислите сумму рангов для каждой выборки. Обозначим сумму рангов для первой выборки как R1, а для второй выборки как R2.
Вычисление U-статистики:
Вычислите U-статистику для каждой выборки по формулам:U1 = n1 * n2 + (n1 * (n1 + 1)) / 2 - R1
U2 = n1 * n2 + (n2 * (n2 + 1)) / 2 - R2

Где:n1 – размер первой выборки.
n2 – размер второй выборки.
R1 – сумма рангов первой выборки.
R2 – сумма рангов второй выборки.
Выберите наименьшее из двух значений U: U = min(U1, U2).
Определение уровня значимости (p-value):Сравните полученное значение U с критическим значением U-критерия, которое можно найти в специальных таблицах для заданного уровня значимости (обычно 0,05 или 0,01) и размеров выборок n1 и n2.
Или, что более удобно, используйте статистические программы (например, SPSS, R, Python) для автоматического вычисления p-value.
Принятие решения:Если U меньше критического значения (или p-value меньше заданного уровня значимости), то отвергается нулевая гипотеза H0, и принимается альтернативная гипотеза H1. Это означает, что между выборками есть статистически значимые различия.
Если U больше или равно критическому значению (или p-value больше или равно заданному уровню значимости), то нет оснований отвергать нулевую гипотезу H0. Это означает, что между выборками нет статистически значимых различий.

IV. Пример:

Допустим, мы хотим сравнить эффективность двух методов обучения чтению у детей. Мы случайным образом разделили детей на две группы: группа A (новый метод) и группа B (традиционный метод). После курса обучения мы оценили уровень чтения каждого ребенка по шкале от 1 до 10.

Результаты:

Группа A: 7, 8, 9, 6, 8
Группа B: 5, 6, 7, 4, 5

Гипотезы:H0: Методы обучения чтению не различаются по эффективности.
H1: Новый метод обучения чтению более эффективен, чем традиционный.
Объединение выборок и ранжирование:

Вычисление ранговых сумм:

R1 (сумма рангов группы A) = 4.5 + 6.5 + 8.5 + 8.5 + 10 = 38
R2 (сумма рангов группы B) = 1 + 2.5 + 2.5 + 4.5 + 6.5 = 17

Вычисление U-статистики:

n1 = 5 (размер группы A)
n2 = 5 (размер группы B)
U1 = 5 * 5 + (5 * (5 + 1)) / 2 - 38 = 25 + 15 - 38 = 2
U2 = 5 * 5 + (5 * (5 + 1)) / 2 - 17 = 25 + 15 - 17 = 23
U = min(2, 23) = 2

Определение уровня значимости (p-value):

Используя таблицы U-критерия или статистическую программу, находим, что для n1 = 5, n2 = 5 и U = 2, p-value = 0.039 (односторонний тест).

Принятие решения:

Поскольку p-value (0.039) меньше заданного уровня значимости (0.05), мы отвергаем нулевую гипотезу H0 и принимаем альтернативную гипотезу H1.
Вывод: Новый метод обучения чтению статистически значимо более эффективен, чем традиционный метод.

V. Преимущества критерия Манна-Уитни:

Непараметрический: Не требует нормального распределения данных.
Прост в применении: Легко вычисляется вручную или с помощью статистических программ.
Устойчив к выбросам: Выбросы в данных оказывают меньшее влияние на результат, чем в параметрических тестах.
Подходит для малых выборок: Может использоваться, когда размер выборок невелик.

VI. Ограничения критерия Манна-Уитни:

Меньшая мощность: По сравнению с параметрическими тестами, критерий Манна-Уитни обладает меньшей статистической мощностью, то есть с меньшей вероятностью обнаруживает существующие различия между группами.
Применимость к ранговым данным: Критерий Манна-Уитни предназначен для данных, измеренных в ранговой шкале. Если данные измерены в интервальной или относительной шкале и имеют нормальное распределение, то более предпочтительным является использование t-критерия Стьюдента.

VII. Использование в статистических программах:

Критерий Манна-Уитни легко реализуется в большинстве статистических программ, таких как SPSS, R, Python (Scipy), Excel (с использованием надстроек). В этих программах достаточно указать две выборки, и программа автоматически вычислит U-статистику и p-value.

VIII. Заключение:

Критерий Манна-Уитни – это полезный инструмент для сравнения двух независимых выборок, когда данные не имеют нормального распределения или измерены в ранговой шкале. Он позволяет определить, есть ли статистически значимые различия между двумя группами, и широко используется в различных областях науки и практики.