Найти в Дзене

Минутка математики, Хи квадрат Пирсона

Критерий Хи квадрат используется для оценки соответствия гипотетических значений ряда наблюдаемым. χ² = Σ (O – E)² / E, где O — наблюдаемые частоты, E — ожидаемые (теоретические) частоты Функции критерия: Чем больше значение χ², тем больше расхождение между наблюдаемыми и ожидаемыми частотами. Что может свидетельствовать о наличии или отсутствии статистически значимой связи между исследуемыми переменными. Пример 1 Компания N в течение года ежедневно собирала данные количестве успешных сделок. Параллельно маркетологи рассчитали прогнозные значения количества успешных сделок. С помощью критерия χ² необходимо проверить значимость прогноза. Дано: Таблица 1 Эмпирические частоты и вероятности Длина классового интервала вычислена по формуле Брукса и Краузеса и равна приблизительно 30, 365/30=12 классовых интервалов. Решение: Таблица 2 Расчёт критерия χ² Таблица 3 Табличные значения χ² Расхождение теоретических и эмпирических значений велико. Значимость прогноза менее 1%. Следовательно, ма

Критерий Хи квадрат используется для оценки соответствия гипотетических значений ряда наблюдаемым.

χ² = Σ (O – E)² / E, где O — наблюдаемые частоты, E — ожидаемые (теоретические) частоты

Функции критерия:

  • Проверка независимости переменных – существует ли связь между двумя переменными.
  • Проверка однородности – определяет сходство законов распределения переменных
  • Проверка согласия – проверка соответствия выборки теоретическому закону распределения.

Чем больше значение χ², тем больше расхождение между наблюдаемыми и ожидаемыми частотами. Что может свидетельствовать о наличии или отсутствии статистически значимой связи между исследуемыми переменными.

Пример 1

Компания N в течение года ежедневно собирала данные количестве успешных сделок. Параллельно маркетологи рассчитали прогнозные значения количества успешных сделок. С помощью критерия χ² необходимо проверить значимость прогноза.

Дано:

Таблица 1 Эмпирические частоты и вероятности

Длина классового интервала вычислена по формуле Брукса и Краузеса и равна приблизительно 30, 365/30=12 классовых интервалов.

Решение:

Таблица 2 Расчёт критерия χ²

-2
  1. Вычислим теоретические частоты (столбец 5) Формула для расчёта теоретических частот: p * N, где p — теоретическая доля, N — количество наблюдений. Значения столбца 5 = столбец 4 * сумма по столбцу 3.
  2. Подставим получившиеся значения в верхнюю часть формулы 1. Столбец 6 = (столбец 3 – столбец 5)^2
  3. Разделим значения столбца 6 на теоретические частоты (столбец 5)
  4. Суммируем получившиеся значения χ² =31,46
  5. Определим число степеней свободы ν по количеству строк k и столбцов с в левой части таблицы (k=12, c=2) v=(12-1)*(2-1)=11
  6. Находим строку 11 в Таблице 3. Значение χ² превышает табличное в 1м столбце.

Таблица 3 Табличные значения χ²

-3

Расхождение теоретических и эмпирических значений велико. Значимость прогноза менее 1%. Следовательно, маркетологи существенно ошиблись при прогнозировании количества сделок.