Добавить в корзинуПозвонить
Найти в Дзене
Statobrabotka

Различия есть, а p > 0.05. Что делать?

Вы видите, что препарат работает: пациентам реально лучше. Боль снижается, анализы улучшаются, качество жизни растёт. Но программа выдаёт предательское p = 0.09. Научный руководитель хмурится. Рецензент пишет: «Статистически не значимо». Все труды в мусорку? Нет. Ни в коем случае. Мировая наука давно отходит от диктатуры жёстких порогов. Проблема не в вашем эффекте — проблема в том, как вы его подаёте. Разберём по шагам, как легально и убедительно защитить «пограничные» результаты перед любой комиссией. Почему p > 0.05 — это не катастрофа Американская статистическая ассоциация (ASA) ещё в 2016 году выпустила заявление: порог p Причина №1: Маленькая выборка Самая частая причина «пограничных» результатов — не хватило статистической мощности (power). Вы набрали 18 человек в группу, а для обнаружения эффекта средней величины нужно было минимум 64. Как это проверить: 🔸 Рассчитайте post-hoc мощность в программе G*Power (бесплатно) 🔸 Если мощность Причина №2: Высокая вариабельность данных Е

Вы видите, что препарат работает: пациентам реально лучше. Боль снижается, анализы улучшаются, качество жизни растёт. Но программа выдаёт предательское p = 0.09. Научный руководитель хмурится. Рецензент пишет: «Статистически не значимо». Все труды в мусорку?

Нет. Ни в коем случае. Мировая наука давно отходит от диктатуры жёстких порогов. Проблема не в вашем эффекте — проблема в том, как вы его подаёте. Разберём по шагам, как легально и убедительно защитить «пограничные» результаты перед любой комиссией.

Почему p > 0.05 — это не катастрофа

Американская статистическая ассоциация (ASA) ещё в 2016 году выпустила заявление: порог p Причина №1: Маленькая выборка

Самая частая причина «пограничных» результатов — не хватило статистической мощности (power). Вы набрали 18 человек в группу, а для обнаружения эффекта средней величины нужно было минимум 64.

Как это проверить:

🔸 Рассчитайте post-hoc мощность в программе G*Power (бесплатно)

🔸 Если мощность Причина №2: Высокая вариабельность данных

Если в вашей группе один пациент выздоровел полностью, а второй — вообще не ответил на лечение, стандартное отклонение взлетает до небес. Математика не может «поверить», что эффект настоящий — слишком много шума.

Что делать:

✅ Проверьте выбросы (outliers) — возможно, один пациент с нетипичной реакцией «размазал» всю картину

✅ Используйте непараметрические критерии (Манна–Уитни вместо t-теста), если данные сильно разбросаны

✅ Укажите медиану и интерквартильный размах — они устойчивее к выбросам, чем среднее

Более подробные гайды по выбору критериев и работе с выбросами вы найдёте на сайте https://statobrabotka.ru — там собраны пошаговые инструкции для врачей-диссертантов.

Главное оружие: доверительные интервалы

Вместо того чтобы фокусироваться на p-value, переключите внимание комиссии на 95% доверительные интервалы (ДИ). Они показывают не «есть или нет различия», а «в каком диапазоне лежит истинный эффект».

Пример: вы сравниваете два метода лечения. Среднее улучшение в основной группе — 7.2 балла, в контрольной — 4.1 балла. Разница = 3.1 балла, p = 0.08. Звучит плохо?

А теперь смотрим 95% ДИ для разницы: от -0.4 до +6.6 балла. Да, интервал зацепил ноль (поэтому p > 0.05), но основная масса значений — в зоне положительного эффекта! Верхняя граница +6.6 — это клинически огромная польза.

Как это подать:

«Различия не достигли порога статистической значимости (p = 0.08), однако 95% доверительный интервал для разницы средних (от -0.4 до +6.6 балла) указывает на потенциально клинически значимое улучшение в основной группе. Нижняя граница интервала близка к нулю, что может быть связано с ограниченным объёмом выборки».

Размер эффекта: Cohen's d, ОШ, RR

Статистическая значимость (p-value) говорит, есть ли эффект вообще. Размер эффекта (effect size) говорит, насколько он сильный. И второе часто важнее первого.

Для сравнения средних считайте Cohen's d:

🔸 d = 0.2 — слабый эффект

🔸 d = 0.5 — средний эффект

🔸 d = 0.8 — сильный эффект

Для бинарных данных (выздоровел / не выздоровел) считайте отношение шансов (ОШ) или относительный риск (RR).

-2

Пример: «Хотя различия не достигли уровня статистической значимости (p = 0.09), размер эффекта составил d = 0.61 (средний по Cohen), что свидетельствует о клинически значимом улучшении в основной группе».

Практические калькуляторы для расчёта размера эффекта и подробные примеры оформления вы найдёте в сообществе https://vk.com/centerstatresearch — там регулярно выходят разборы реальных кейсов.

Клиническая значимость важнее статистической

Задайте себе вопрос: если ваш препарат снижает риск инсульта на 15%, но p = 0.07 — вы откажетесь его применять? Конечно, нет. Потому что для пациента это может быть вопрос жизни и смерти.

Клиническая значимость — это минимальное изменение показателя, которое реально улучшает состояние пациента. Для боли по ВАШ это 1.5–2 балла. Для качества жизни по SF-36 — 5–10 баллов. Для артериального давления — 5–10 мм рт. ст.

Как это оформить:

«Несмотря на отсутствие статистической значимости (p = 0.08), наблюдаемое снижение систолического АД на 8.3 мм рт. ст. превышает минимально клинически значимое различие (MCID = 5 мм рт. ст.) и может иметь практическое значение для ведения пациентов с артериальной гипертензией».

Чего НЕ делать: запретные фразы

Ни в коем случае не пишите:

❌ «Имеется тенденция к улучшению» — рецензенты это ненавидят, за такое отклоняют статьи

❌ «Различия близки к статистически значимым» — p = 0.06 и p = 0.6 одинаково «не значимы» с точки зрения формальной логики

-3

❌ «Результаты можно считать положительными» — нет, нельзя, если вы заранее не заявили альфа-уровень 0.1

Вместо этого:

✅ Честно укажите p-value

✅ Приведите доверительные интервалы

✅ Рассчитайте размер эффекта

✅ Объясните клиническую значимость

✅ Укажите ограничения (маленькая выборка, высокая вариабельность)

Как защитить результаты на диссертационном совете

Когда комиссия спросит: «Почему у вас p > 0.05?», не впадайте в панику. Ваш план:

1. «Различия не достигли порога статистической значимости (p = 0.08), что может быть связано с ограниченным объёмом выборки (статистическая мощность 68%)».

2. «Тем не менее, 95% доверительный интервал для разницы средних указывает на потенциально клинически значимое улучшение».

-4

3. «Размер эффекта составил d = 0.58 (средний по Cohen), что соответствует клинически значимому изменению для данной популяции».

4. «Полученные результаты согласуются с данными исследования [автор, год], где при сопоставимом объёме выборки также наблюдался аналогичный тренд».

5. «В дальнейших исследованиях планируется увеличение выборки для подтверждения наблюдаемого эффекта».

Эта аргументация закрывает все вопросы и показывает, что вы глубоко понимаете статистику.

Когда p > 0.05 действительно означает провал

Будем честны: иногда p > 0.05 означает, что эффекта просто нет. Как это понять?

🔸 Доверительный интервал симметрично охватывает ноль (например, от -3 до +3)

🔸 Размер эффекта мизерный (d Итого: ваш план действий

Если вы получили p > 0.05, но видите клинический эффект:

✅ Рассчитайте 95% доверительные интервалы

✅ Посчитайте размер эффекта (Cohen's d, ОШ, RR)

✅ Оцените статистическую мощность (post-hoc power)

✅ Опишите клиническую значимость результата

✅ Укажите ограничения исследования (объём выборки, вариабельность)

✅ Постройте график, чтобы показать тренд визуально

-5

✅ Найдите аналогичные исследования в литературе для поддержки

Эта стратегия позволит вам защитить результаты перед любой комиссией — даже самой строгой.

Более детальные разборы, примеры формулировок и пошаговые инструкции вы найдёте на https://statobrabotka.ru и в сообществе https://vk.com/centerstatresearch.

Нужна помощь с аргументацией?

Если вы получили «пограничные» результаты и не знаете, как их защитить, отправьте вашу главу Results на info@statobrabotka.ru. Мы разберём:

🔹 Где добавить доверительные интервалы

🔹 Как рассчитать размер эффекта

🔹 Какие фразы использовать в Discussion

🔹 Как отвечать на вопросы комиссии

Мы знаем, как защитить каждый результат — даже если p > 0.05.