Вы видите, что препарат работает: пациентам реально лучше. Боль снижается, анализы улучшаются, качество жизни растёт. Но программа выдаёт предательское p = 0.09. Научный руководитель хмурится. Рецензент пишет: «Статистически не значимо». Все труды в мусорку?
Нет. Ни в коем случае. Мировая наука давно отходит от диктатуры жёстких порогов. Проблема не в вашем эффекте — проблема в том, как вы его подаёте. Разберём по шагам, как легально и убедительно защитить «пограничные» результаты перед любой комиссией.
Почему p > 0.05 — это не катастрофа
Американская статистическая ассоциация (ASA) ещё в 2016 году выпустила заявление: порог p Причина №1: Маленькая выборка
Самая частая причина «пограничных» результатов — не хватило статистической мощности (power). Вы набрали 18 человек в группу, а для обнаружения эффекта средней величины нужно было минимум 64.
Как это проверить:
🔸 Рассчитайте post-hoc мощность в программе G*Power (бесплатно)
🔸 Если мощность Причина №2: Высокая вариабельность данных
Если в вашей группе один пациент выздоровел полностью, а второй — вообще не ответил на лечение, стандартное отклонение взлетает до небес. Математика не может «поверить», что эффект настоящий — слишком много шума.
Что делать:
✅ Проверьте выбросы (outliers) — возможно, один пациент с нетипичной реакцией «размазал» всю картину
✅ Используйте непараметрические критерии (Манна–Уитни вместо t-теста), если данные сильно разбросаны
✅ Укажите медиану и интерквартильный размах — они устойчивее к выбросам, чем среднее
Более подробные гайды по выбору критериев и работе с выбросами вы найдёте на сайте https://statobrabotka.ru — там собраны пошаговые инструкции для врачей-диссертантов.
Главное оружие: доверительные интервалы
Вместо того чтобы фокусироваться на p-value, переключите внимание комиссии на 95% доверительные интервалы (ДИ). Они показывают не «есть или нет различия», а «в каком диапазоне лежит истинный эффект».
Пример: вы сравниваете два метода лечения. Среднее улучшение в основной группе — 7.2 балла, в контрольной — 4.1 балла. Разница = 3.1 балла, p = 0.08. Звучит плохо?
А теперь смотрим 95% ДИ для разницы: от -0.4 до +6.6 балла. Да, интервал зацепил ноль (поэтому p > 0.05), но основная масса значений — в зоне положительного эффекта! Верхняя граница +6.6 — это клинически огромная польза.
Как это подать:
«Различия не достигли порога статистической значимости (p = 0.08), однако 95% доверительный интервал для разницы средних (от -0.4 до +6.6 балла) указывает на потенциально клинически значимое улучшение в основной группе. Нижняя граница интервала близка к нулю, что может быть связано с ограниченным объёмом выборки».
Размер эффекта: Cohen's d, ОШ, RR
Статистическая значимость (p-value) говорит, есть ли эффект вообще. Размер эффекта (effect size) говорит, насколько он сильный. И второе часто важнее первого.
Для сравнения средних считайте Cohen's d:
🔸 d = 0.2 — слабый эффект
🔸 d = 0.5 — средний эффект
🔸 d = 0.8 — сильный эффект
Для бинарных данных (выздоровел / не выздоровел) считайте отношение шансов (ОШ) или относительный риск (RR).
Пример: «Хотя различия не достигли уровня статистической значимости (p = 0.09), размер эффекта составил d = 0.61 (средний по Cohen), что свидетельствует о клинически значимом улучшении в основной группе».
Практические калькуляторы для расчёта размера эффекта и подробные примеры оформления вы найдёте в сообществе https://vk.com/centerstatresearch — там регулярно выходят разборы реальных кейсов.
Клиническая значимость важнее статистической
Задайте себе вопрос: если ваш препарат снижает риск инсульта на 15%, но p = 0.07 — вы откажетесь его применять? Конечно, нет. Потому что для пациента это может быть вопрос жизни и смерти.
Клиническая значимость — это минимальное изменение показателя, которое реально улучшает состояние пациента. Для боли по ВАШ это 1.5–2 балла. Для качества жизни по SF-36 — 5–10 баллов. Для артериального давления — 5–10 мм рт. ст.
Как это оформить:
«Несмотря на отсутствие статистической значимости (p = 0.08), наблюдаемое снижение систолического АД на 8.3 мм рт. ст. превышает минимально клинически значимое различие (MCID = 5 мм рт. ст.) и может иметь практическое значение для ведения пациентов с артериальной гипертензией».
Чего НЕ делать: запретные фразы
Ни в коем случае не пишите:
❌ «Имеется тенденция к улучшению» — рецензенты это ненавидят, за такое отклоняют статьи
❌ «Различия близки к статистически значимым» — p = 0.06 и p = 0.6 одинаково «не значимы» с точки зрения формальной логики
❌ «Результаты можно считать положительными» — нет, нельзя, если вы заранее не заявили альфа-уровень 0.1
Вместо этого:
✅ Честно укажите p-value
✅ Приведите доверительные интервалы
✅ Рассчитайте размер эффекта
✅ Объясните клиническую значимость
✅ Укажите ограничения (маленькая выборка, высокая вариабельность)
Как защитить результаты на диссертационном совете
Когда комиссия спросит: «Почему у вас p > 0.05?», не впадайте в панику. Ваш план:
1. «Различия не достигли порога статистической значимости (p = 0.08), что может быть связано с ограниченным объёмом выборки (статистическая мощность 68%)».
2. «Тем не менее, 95% доверительный интервал для разницы средних указывает на потенциально клинически значимое улучшение».
3. «Размер эффекта составил d = 0.58 (средний по Cohen), что соответствует клинически значимому изменению для данной популяции».
4. «Полученные результаты согласуются с данными исследования [автор, год], где при сопоставимом объёме выборки также наблюдался аналогичный тренд».
5. «В дальнейших исследованиях планируется увеличение выборки для подтверждения наблюдаемого эффекта».
Эта аргументация закрывает все вопросы и показывает, что вы глубоко понимаете статистику.
Когда p > 0.05 действительно означает провал
Будем честны: иногда p > 0.05 означает, что эффекта просто нет. Как это понять?
🔸 Доверительный интервал симметрично охватывает ноль (например, от -3 до +3)
🔸 Размер эффекта мизерный (d Итого: ваш план действий
Если вы получили p > 0.05, но видите клинический эффект:
✅ Рассчитайте 95% доверительные интервалы
✅ Посчитайте размер эффекта (Cohen's d, ОШ, RR)
✅ Оцените статистическую мощность (post-hoc power)
✅ Опишите клиническую значимость результата
✅ Укажите ограничения исследования (объём выборки, вариабельность)
✅ Постройте график, чтобы показать тренд визуально
✅ Найдите аналогичные исследования в литературе для поддержки
Эта стратегия позволит вам защитить результаты перед любой комиссией — даже самой строгой.
Более детальные разборы, примеры формулировок и пошаговые инструкции вы найдёте на https://statobrabotka.ru и в сообществе https://vk.com/centerstatresearch.
Нужна помощь с аргументацией?
Если вы получили «пограничные» результаты и не знаете, как их защитить, отправьте вашу главу Results на info@statobrabotka.ru. Мы разберём:
🔹 Где добавить доверительные интервалы
🔹 Как рассчитать размер эффекта
🔹 Какие фразы использовать в Discussion
🔹 Как отвечать на вопросы комиссии
Мы знаем, как защитить каждый результат — даже если p > 0.05.