Найти в Дзене

Критерий манна уитни

Критерий Манна-Уитни (U-критерий Манна-Уитни, Mann-Whitney U test) – это непараметрический статистический тест, который используется для сравнения двух независимых выборок по количественному признаку. В отличие от t-критерия Стьюдента, критерий Манна-Уитни не требует нормального распределения данных и применяется, когда данные измерены в ранговой шкале или когда нарушены условия применимости t-критерия. I. Суть критерия Манна-Уитни: II. Условия применения критерия Манна-Уитни: III. Этапы проведения критерия Манна-Уитни: IV. Пример: Допустим, мы хотим сравнить эффективность двух методов обучения чтению у детей. Мы случайным образом разделили детей на две группы: группа A (новый метод) и группа B (традиционный метод). После курса обучения мы оценили уровень чтения каждого ребенка по шкале от 1 до 10. Результаты: V. Преимущества критерия Манна-Уитни: VI. Ограничения критерия Манна-Уитни: VII. Использование в статистических программах: Критерий Манна-Уитни легко реализуется в большинстве с

Критерий Манна-Уитни (U-критерий Манна-Уитни, Mann-Whitney U test) – это непараметрический статистический тест, который используется для сравнения двух независимых выборок по количественному признаку. В отличие от t-критерия Стьюдента, критерий Манна-Уитни не требует нормального распределения данных и применяется, когда данные измерены в ранговой шкале или когда нарушены условия применимости t-критерия.

I. Суть критерия Манна-Уитни:

  • Цель: Определение, различаются ли статистически значимо два набора данных, измеренных по крайней мере в порядковой шкале. Он проверяет гипотезу о том, что две выборки взяты из одной и той же популяции.
  • Основная идея: Критерий Манна-Уитни оценивает, насколько часто значения одной выборки превышают значения другой выборки. Если значения одной выборки систематически выше, чем значения другой выборки, то можно сделать вывод о статистически значимом различии между двумя группами.
  • Преимущества: Не требует нормального распределения данных, устойчив к выбросам, может использоваться для малых выборок.

II. Условия применения критерия Манна-Уитни:

  1. Две независимые выборки: Данные должны быть получены из двух независимых групп (например, экспериментальная группа и контрольная группа).
  2. Измерение в ранговой шкале: Данные должны быть измерены по крайней мере в ранговой (порядковой) шкале, то есть значения можно упорядочить по возрастанию или убыванию.
  3. Отсутствие нормального распределения: Критерий Манна-Уитни особенно полезен, когда данные не имеют нормального распределения, что делает невозможным применение параметрических тестов, таких как t-критерий Стьюдента.

III. Этапы проведения критерия Манна-Уитни:

  1. Формулирование гипотез:Нулевая гипотеза (H0): Распределения признака в обеих выборках одинаковы (между выборками нет статистически значимых различий).
    Альтернативная гипотеза (H1): Распределения признака в обеих выборках различны (между выборками есть статистически значимые различия). Альтернативная гипотеза может быть односторонней (например, значения в одной выборке больше, чем в другой) или двусторонней (значения в выборках просто различаются).
  2. Объединение выборок и ранжирование:Объедините значения обеих выборок в одну общую выборку.
    Упорядочите все значения объединенной выборки по возрастанию или убыванию.
    Присвойте каждому значению ранг (порядковый номер) в объединенной выборке.
    Если есть одинаковые значения (связанные ранги), присвойте им средний ранг.
    Пример: Если два значения занимают 5-е и 6-е места, присвойте им обоим ранг (5+6)/2 = 5,5.
  3. Вычисление ранговых сумм:Разделите объединенную выборку обратно на исходные две выборки.
    Вычислите сумму рангов для каждой выборки. Обозначим сумму рангов для первой выборки как R1, а для второй выборки как R2.
  4. Вычисление U-статистики:
    Вычислите U-статистику для каждой выборки по формулам:U1 = n1 * n2 + (n1 * (n1 + 1)) / 2 - R1
    U2 = n1 * n2 + (n2 * (n2 + 1)) / 2 - R2

    Где:n1 – размер первой выборки.
    n2 – размер второй выборки.
    R1 – сумма рангов первой выборки.
    R2 – сумма рангов второй выборки.
    Выберите наименьшее из двух значений U: U = min(U1, U2).
  5. Определение уровня значимости (p-value):Сравните полученное значение U с критическим значением U-критерия, которое можно найти в специальных таблицах для заданного уровня значимости (обычно 0,05 или 0,01) и размеров выборок n1 и n2.
    Или, что более удобно, используйте статистические программы (например, SPSS, R, Python) для автоматического вычисления p-value.
  6. Принятие решения:Если U меньше критического значения (или p-value меньше заданного уровня значимости), то отвергается нулевая гипотеза H0, и принимается альтернативная гипотеза H1. Это означает, что между выборками есть статистически значимые различия.
    Если U больше или равно критическому значению (или p-value больше или равно заданному уровню значимости), то нет оснований отвергать нулевую гипотезу H0. Это означает, что между выборками нет статистически значимых различий.

IV. Пример:

Допустим, мы хотим сравнить эффективность двух методов обучения чтению у детей. Мы случайным образом разделили детей на две группы: группа A (новый метод) и группа B (традиционный метод). После курса обучения мы оценили уровень чтения каждого ребенка по шкале от 1 до 10.

Результаты:

  • Группа A: 7, 8, 9, 6, 8
  • Группа B: 5, 6, 7, 4, 5
  1. Гипотезы:H0: Методы обучения чтению не различаются по эффективности.
    H1: Новый метод обучения чтению более эффективен, чем традиционный.
  2. Объединение выборок и ранжирование:
  1. Вычисление ранговых сумм:
  • R1 (сумма рангов группы A) = 4.5 + 6.5 + 8.5 + 8.5 + 10 = 38
  • R2 (сумма рангов группы B) = 1 + 2.5 + 2.5 + 4.5 + 6.5 = 17
  1. Вычисление U-статистики:
  • n1 = 5 (размер группы A)
  • n2 = 5 (размер группы B)
  • U1 = 5 * 5 + (5 * (5 + 1)) / 2 - 38 = 25 + 15 - 38 = 2
  • U2 = 5 * 5 + (5 * (5 + 1)) / 2 - 17 = 25 + 15 - 17 = 23
  • U = min(2, 23) = 2
  1. Определение уровня значимости (p-value):
  • Используя таблицы U-критерия или статистическую программу, находим, что для n1 = 5, n2 = 5 и U = 2, p-value = 0.039 (односторонний тест).
  1. Принятие решения:
  • Поскольку p-value (0.039) меньше заданного уровня значимости (0.05), мы отвергаем нулевую гипотезу H0 и принимаем альтернативную гипотезу H1.
  • Вывод: Новый метод обучения чтению статистически значимо более эффективен, чем традиционный метод.

V. Преимущества критерия Манна-Уитни:

  • Непараметрический: Не требует нормального распределения данных.
  • Прост в применении: Легко вычисляется вручную или с помощью статистических программ.
  • Устойчив к выбросам: Выбросы в данных оказывают меньшее влияние на результат, чем в параметрических тестах.
  • Подходит для малых выборок: Может использоваться, когда размер выборок невелик.

VI. Ограничения критерия Манна-Уитни:

  • Меньшая мощность: По сравнению с параметрическими тестами, критерий Манна-Уитни обладает меньшей статистической мощностью, то есть с меньшей вероятностью обнаруживает существующие различия между группами.
  • Применимость к ранговым данным: Критерий Манна-Уитни предназначен для данных, измеренных в ранговой шкале. Если данные измерены в интервальной или относительной шкале и имеют нормальное распределение, то более предпочтительным является использование t-критерия Стьюдента.

VII. Использование в статистических программах:

Критерий Манна-Уитни легко реализуется в большинстве статистических программ, таких как SPSS, R, Python (Scipy), Excel (с использованием надстроек). В этих программах достаточно указать две выборки, и программа автоматически вычислит U-статистику и p-value.

VIII. Заключение:

Критерий Манна-Уитни – это полезный инструмент для сравнения двух независимых выборок, когда данные не имеют нормального распределения или измерены в ранговой шкале. Он позволяет определить, есть ли статистически значимые различия между двумя группами, и широко используется в различных областях науки и практики.