Найти в Дзене
MedStat Solutions

Хи-квадрат Пирсона: не хи, а кси

В медицинских исследованиях важно не только находить зависимости между переменными, но и доказывать их статистическую значимость. Одним из наиболее популярных инструментов для этого является хи-квадрат тест Пирсона. Давайте разберём, что это за метод, где он применяется в медицине, и как решается реальная задача с его помощью. Тест хи-квадрат (χ²) Пирсона применяется для проверки связи между категориальными переменными. Он помогает ответить на вопрос: существует ли статистически значимая связь между переменными, или наблюдаемая разница могла возникнуть случайно?
Пример вопроса: Есть ли связь между курением (да/нет) и развитием гипертонии (да/нет)?
Тест основан на сравнении наблюдаемых частот (из данных) с ожидаемыми частотами (если бы связь отсутствовала). Задача: Проверить, есть ли связь между курением и развитием гипертонии. Данные представлены в таблице: Ожидаемые частоты рассчитываются по формуле: Для ячейки "Курит + Есть гипертония":
Е = (60*70)/140 = 30 Проделываем это для всех
Оглавление

В медицинских исследованиях важно не только находить зависимости между переменными, но и доказывать их статистическую значимость. Одним из наиболее популярных инструментов для этого является хи-квадрат тест Пирсона. Давайте разберём, что это за метод, где он применяется в медицине, и как решается реальная задача с его помощью.

📊 Что такое хи-квадрат Пирсона?

Тест хи-квадрат (χ²) Пирсона применяется для проверки связи между категориальными переменными. Он помогает ответить на вопрос: существует ли статистически значимая связь между переменными, или наблюдаемая разница могла возникнуть случайно?
Пример вопроса: Есть ли связь между курением (да/нет) и развитием гипертонии (да/нет)?
Тест основан на сравнении
наблюдаемых частот (из данных) с ожидаемыми частотами (если бы связь отсутствовала).

🏥 Примеры применения в медицине

  1. Связь факторов риска и заболеваний:Курение и риск рака лёгких.
    Уровень физической активности и вероятность развития диабета.
  2. Эффективность лечения:Частота выздоровления пациентов в двух группах: с препаратом A и препаратом B.
  3. Анализ частоты осложнений:Сравнение доли осложнений в группах с разными хирургическими техниками.
  4. Генетические исследования:Анализ связи между генотипами и наличием определённого заболевания.

🧮 Решим задачу

Задача: Проверить, есть ли связь между курением и развитием гипертонии.

Данные представлены в таблице:

-2

Шаг 1: Формулируем гипотезы

  • H₀ (нулевая гипотеза): Курение не связано с гипертонией.
  • H₁ (альтернативная гипотеза): Курение связано с гипертонией.

Шаг 2: Рассчитываем ожидаемые частоты

Ожидаемые частоты рассчитываются по формуле:

-3

Для ячейки "Курит + Есть гипертония":
Е = (60*70)/140 = 30

Проделываем это для всех ячеек:

-4

Шаг 3: Рассчитываем хи-квадрат

Формула хи-квадрат:

-5

где:

  • O — наблюдаемое значение (частоты из данных),
  • E — ожидаемое значение,
  • ∑ — сумма для всех ячеек.

Для каждой ячейки нашей новой таблицы:

-6

Итог:
χ2 = 3.33 + 3.33 + 2.5 + 2.5 = 11.66

Шаг 4: Сравниваем с критическим значением

Степени свободы:
df=(r−1)⋅(c−1)=(2−1)⋅(2−1)=1
где:

  • rr — количество строк в таблице сопряжённости,
  • cc — количество столбцов в таблице сопряжённости.

При уровне значимости α=0.05, критическое значение χ² = 3.84.

Вывод: Так как χ2 = 11.66 > 3.84, мы отвергаем нулевую гипотезу.
Курение действительно связано с гипертонией.

🔑 Итоги

  • Хи-квадрат тест Пирсона — простой, но мощный инструмент для анализа категориальных данных.
  • Он помогает медикам и исследователям проверять гипотезы о связях между переменными.
  • Главное помнить: χ² показывает наличие связи, но не её силу — для этого используют дополнительные коэффициенты