Непараметрические критерии (или критерии знаков) — это статистические методы, используемые для проверки гипотез о распределениях, когда данные не соответствуют требованиям параметрических тестов (например, нормальности распределения) или когда данные измерены в порядковой или номинальной шкале. Они основаны на ранжировании данных или подсчете частот, а не на оценке параметров распределения (среднего, дисперсии).
Основные преимущества непараметрических критериев:
- Не требуют знания вида распределения: Их можно использовать, когда распределение данных неизвестно или не соответствует нормальному.
- Подходят для данных, измеренных в порядковой или номинальной шкале: В этих шкалах нельзя вычислять среднее значение, поэтому параметрические тесты неприменимы.
- Устойчивы к выбросам: На результаты не так сильно влияют экстремальные значения, как в параметрических тестах.
Основные недостатки непараметрических критериев:
- Меньшая мощность: При прочих равных условиях, они могут быть менее чувствительны к различиям между группами, чем параметрические тесты (т.е., сложнее обнаружить статистически значимые различия, когда они есть).
- Меньше информации: Используют меньше информации из выборки, чем параметрические тесты (игнорируют конкретные значения, а используют только ранги или знаки).
Наиболее распространенные непараметрические критерии:
- Критерий знаков (Sign Test):Используется для проверки гипотезы о медиане.
Подходит для парных выборок (одна и та же группа измеряется дважды) или для одной выборки, когда нужно проверить, превышает ли медиана определенное значение.
Основан на подсчете количества положительных и отрицательных разностей между значениями.
Пример: Оценить, улучшилось ли состояние пациентов после лечения, сравнив их показатели до и после лечения. - Критерий Вилкоксона (Wilcoxon Signed-Rank Test):Используется для проверки гипотезы о медиане.
Учитывает не только знак разности, но и ее ранг.
Более мощный, чем критерий знаков.
Подходит для парных выборок, когда можно ранжировать разности между значениями.
Пример: Сравнить эффективность двух разных методов обучения, измерив результаты одной и той же группы студентов после каждого метода. - Критерий Манна-Уитни (Mann-Whitney U Test):Используется для сравнения двух независимых выборок.
Проверяет гипотезу о том, что распределения двух популяций одинаковы.
Основан на ранжировании всех значений из обеих выборок и сравнении сумм рангов для каждой группы.
Пример: Сравнить результаты экзамена у студентов, обучающихся по разным программам. - Критерий Крускала-Уоллиса (Kruskal-Wallis Test):Является непараметрическим аналогом однофакторного дисперсионного анализа (ANOVA).
Используется для сравнения трех и более независимых выборок.
Проверяет гипотезу о том, что распределения всех популяций одинаковы.
Основан на ранжировании всех значений из всех выборок и сравнении сумм рангов для каждой группы.
Пример: Сравнить результаты теста на внимательность у людей, работающих в разные смены. - Критерий хи-квадрат (Chi-Square Test):Используется для анализа категориальных данных.
Может использоваться для проверки гипотезы о независимости двух категориальных переменных (критерий независимости) или для проверки соответствия наблюдаемого распределения ожидаемому (критерий согласия).
Основан на сравнении наблюдаемых и ожидаемых частот в каждой категории.
Пример (критерий независимости): Оценить, есть ли связь между полом человека и его предпочтениями в выборе политической партии.
Пример (критерий согласия): Проверить, соответствует ли распределение цветов конфет в пакете заявленному производителем. - Коэффициенты ранговой корреляции Спирмена и Кендалла:Используются для измерения силы и направления связи между двумя переменными, измеренными в порядковой шкале.
Основаны на ранжировании значений каждой переменной и сравнении рангов.
Пример: Оценить, есть ли связь между успеваемостью студентов и их посещаемостью занятий.
Выбор непараметрического критерия:
Выбор подходящего непараметрического критерия зависит от:
- Типа данных: Шкала измерения (номинальная, порядковая, интервальная, отношений).
- Количества групп: Сравниваются две или более группы.
- Зависимости выборок: Выборки независимы или парные.
- Гипотезы: Что именно нужно проверить.
Пример принятия решения:
- Если у вас есть две парные выборки (например, результаты теста до и после обучения) и вы хотите проверить, изменилась ли медиана, используйте критерий Вилкоксона. Если нет уверенности, что разности можно ранжировать, то критерий знаков.
- Если у вас есть две независимые выборки и вы хотите проверить, отличаются ли их распределения, используйте критерий Манна-Уитни.
- Если у вас есть три или более независимые выборки и вы хотите проверить, отличаются ли их распределения, используйте критерий Крускала-Уоллиса.
- Если у вас есть две категориальные переменные и вы хотите проверить, связаны ли они, используйте критерий хи-квадрат.
Важно понимать, что непараметрические критерии - это лишь один из инструментов статистического анализа. При принятии решения о выборе критерия необходимо учитывать все особенности данных и задачи исследования.