Найти в Дзене
Art of Data&Statistics

Критерий серий (критерий r) Вальда-Вольфовица (Wald-Wolfowitz run test)

Критерий серий Вальда—Вольфовица (Wald-Wolfowitz run test), или критерий r— это непараметрический критерий, названный в честь статистиков Абрахама Вальда и Джейкоба Вольфовица. Критерий r проверяет гипотезу о случайности для двух последовательностей данных, т.е. выборок. Иными словами, критерий Вальда—Вольфовица позволяет ответить на вопрос: из одной или из двух популяций извлечена выборка? Данные, которыми мы располагаем, являются однородными? Wald-Wolfowitz run test основан на анализе закономерностей последовательности распределения данных, которые принадлежат к двум выборкам. Может применяться при анализе количественных (непрерывные и относительные) и качественных (номинальные и порядковые) переменных. Допустим, мы измеряем уровень артериального давления у испытуемых, и эксперимент затянулся. Получается, что у первой части испытуемых давление измеряли сразу после того, как они прибыли в процедурный кабинет. А вторая часть была несколько измучена длительным ожиданием! И исследователь

Критерий серий Вальда—Вольфовица (Wald-Wolfowitz run test), или критерий r— это непараметрический критерий, названный в честь статистиков Абрахама Вальда и Джейкоба Вольфовица.

Критерий r проверяет гипотезу о случайности для двух последовательностей данных, т.е. выборок. Иными словами, критерий Вальда—Вольфовица позволяет ответить на вопрос: из одной или из двух популяций извлечена выборка? Данные, которыми мы располагаем, являются однородными? Wald-Wolfowitz run test основан на анализе закономерностей последовательности распределения данных, которые принадлежат к двум выборкам. Может применяться при анализе количественных (непрерывные и относительные) и качественных (номинальные и порядковые) переменных.

Когда исследователю может пригодиться тест Вальда—Вольфовица?

Допустим, мы измеряем уровень артериального давления у испытуемых, и эксперимент затянулся. Получается, что у первой части испытуемых давление измеряли сразу после того, как они прибыли в процедурный кабинет. А вторая часть была несколько измучена длительным ожиданием! И исследователь обеспокоен тем, что показатель артериального давления в первой части экспериментов (Xi = X1, X2, X3...) может чаще отклоняться в одну сторону, а во второй части эксперимента (Yi = Y1, Y2, Y3...) — в иную. Вот тут-то критерий серий Вальда—Вольфовица способен дать статистически обоснованный вывод о существенных различиях между двумя выборками Xi и Yi, оставляя «за скобками», в чём именно эти различия состоят.

  • Нулевая гипотеза Н0: ряды Х и Y являются двумя выборками из одной генеральной совокупности, то есть данные однородны.
  • Альтернативная гипотеза Н1: ряды Х и Y являются двумя выборками из разных генеральных совокупностей, то есть данные неоднородны.

Пример: требуется оценить, однородны ли данные о количестве глиальных клеток в головном мозге крыс линии Lewis и Long-Evans.

-2

В том случае, если эти данные однородны, экспериментатор планирует объединить их и использовать в дальнейших расчётах вместе, без указания на то, что данные получены у животных разных линий.

1. Количество глиальных клеток у крыс линии Lewis – это выборка Xi, у крыс линии Long-Evans - выборка Yi. Расположим две выборки друг под другом:

-3

2. Теперь расположим все значения в один возрастающий ряд (проранжируем их), помещая для ясности Xi и Yi в разных строках:

-4

Элементы одной из последовательностей, следующие подряд, образуют так называемую серию. Число серий (r) в нашем случае равно 4. Отметим также, что повторяющиеся значения (так называемые узлы), отсутствуют.

3. Посмотрим в таблицу критических значений числа серий r. В таблице значений критерия Вальда—Вольфовица для каждого сочетания n приводится два числа. Потому что считается статистически маловероятным появление как малого количества больших серий, так и большого числа малых серий.

-5
  • Если количество серий попадает в указанный интервал, то принимается нулевая гипотеза Н0 - данные из двух выборок – однородны.
  • В противном случае принимается альтернативная гипотеза Н1 о том, что данные из двух выборок не являются однородными.

Для наших данных о количестве глиальных клеток у крыс линии Lewis и Long-Evans: r = 4. И это значение попадает в табличный интервал 3 - 11.

Мы можем сделать вывод об одородности данных, и экспериментатор имеет право объединить их в единую последовательность.

*4. Часто метод Вальда—Вольфовица приравнивают к числу серий (r). Но для больших выборок приходится рассчитывать стандартизированное значение z:

, где mr и σr — среднее значение и стандартное отклонение.
, где mr и σr — среднее значение и стандартное отклонение.

Формулы для расчёта mr и σr:

-7

** Критерий серий Вальда—Вольфовица хоть и позволяет выявить различия между двумя выборками, но при этом его нельзя назвать полноценной непараметрической альтернативой t - критерия для независимых выборок (по группам или для независимых переменных). Для этого Z-критерию не хватает чувствительности. Для оценки различий двух независимых выборок, распределение которых не укладывается в нормальный закон, лучше пользоваться U-критерием Манна-Уитни.