Вы обошли три отделения, потратили месяцы на сбор анкет, свели данные в таблицу — и отправили рукопись в журнал. Ответ рецензента приходит через шесть недель: «Статистически незначимо. Недостаточный объём выборки». Как такое возможно, если вы собрали сто пациентов?
Главная ошибка: выборка «сколько успели»
В 87% диссертаций, которые мы аудируем, объём выборки взят «с потолка»: «Успели собрать 100 человек за полгода — значит, хватит». Это не методология — это лотерея. Размер выборки рассчитывается ДО начала исследования на основе трёх параметров:
🔸 Ожидаемый размер эффекта — насколько сильно различаются группы (например, снижение давления на 10 мм рт. ст. или на 2 мм рт. ст.)
🔸 Уровень значимости α — вероятность ложноположительного результата (обычно 0,05)
🔸 Мощность исследования (1−β) — вероятность обнаружить эффект, есл
и он есть (стандарт 80%)
Если эффект слабый, а выборка маленькая — даже реальное различие между группами останется «статистически незначимым». Вы потратили год на сбор данных впустую.
Пример из практики: когда 100 пациентов — это мало
Кардиолог исследовал два метода контроля гипертонии. Набрал по 50 человек в каждую группу (всего n=100). Различие в среднем систолическом давлении составило 8 мм рт. ст., стандартное отклонение — 15 мм рт. ст. Применил t-критерий Стьюдента — получил p=0,09. Незначимо.
Мы провели post-hoc power analysis: при таких параметрах мощность исследования составила всего 52% — то есть шанс обнаружить реальный эффект был равен подбрасыванию монетки. Для мощности 80% требовалось минимум 94 пациента на группу (всего 188 человек).
Автор дополнил выборку данными из архива клиники, довёл до n=200 — и получил p=0,031. Статья прошла рецензию с первого раза.
Как правильно рассчитать выборку: п
ошаговая инструкция
Шаг 1. Определите дизайн исследования.
РКИ, когорта, случай-контроль, одна группа до/после? От этого зависит формула расчёта.
Шаг 2. Укажите ожидаемый размер эффекта.
Опирайтесь на литературу: какие различия показывали похожие исследования? Если данных нет — закладывайте средний эффект (Cohen's d ≈ 0,5).
Шаг 3. Задайте уровни α и β.
Стандарт: α=0,05 (вероятность ошибки I рода 5%), β=0,2 (мощность 80%). Для более строгих требований (например, скрининговые тесты) можно взять β=0,1 (мощность 90%) — но выборка вырастет на 30–40%.
Шаг 4. Рассчитайте минимальный объём.
Используйте калькуляторы (G*Power, R-пакет «pwr») или формулы для конкретного критерия. Например, для сравнения двух средних:
n = 2 × (Zα + Zβ)² × σ² / Δ²,
где Δ — ожидаемое различие, σ — стандартное отклонение.
Шаг 5. Заложите запас на выбывание.
Если ожидаете 10% пот
ерь при наблюдении — увеличьте расчётный объём на 10–15%.
Больше примеров и методик вы найдёте на сайте https://statobrabotka.ru — там же можно заказать расчёт выборки под ваш дизайн.
Когда 100 пациентов достаточно — а когда нет
Выборка в 100 человек может быть адекватной, если:
🔸 Эффект сильный (например, различие групп >1 стандартного отклонения)
🔸 Вы сравниваете бинарные исходы с частотой событий >20% в обеих группах
🔸 Используете парные дизайны (до/после на одних и тех же пациентах)
Но если эффект слабый (Что делать, если выборка уже собрана — и она мала?
1. Проведите post-hoc power analysis: оцените,
какова была реальная мощность вашего теста. Если >70% — можно указать в ограничениях исследования и идти дальше.
2. Объедините данные с другими центрами (мультицентровое исследование) или используйте архивные базы клиники.
3. Смените дизайн на более мощный: вместо независимых групп — парный анализ; вместо t-теста — регрессия с ковариатами (ANCOVA).
4. Если ничего не помогает — честно укажите недостаточную мощность как limitation и опубликуйтесь в журнале с меньшим импакт-фактором.
Подробные разборы таких кейсов и обсуждение методов публикуем в нашей группе ВКонтакте: https://vk.com/centerstatresearch — присоединяйтесь, чтобы не пропустить новые материалы.
Чек-лист перед стартом исследования
Прежде чем собирать первую анкету, проверьте:
☑ Есть ли обоснование объёма выборки (формула, ссылка на калькулятор, цитата из методической литературы)?
☑ Указаны ли α, β, ожидаемый размер эффекта?
☑ Учтён ли запас на выбывание
и отказы?
☑ Совпадает ли расчёт с дизайном (не взяли формулу для РКИ в наблюдательном исследовании)?
☑ Реалистичен ли объём для вашей клиники (если формула требует 500 пациентов, а у вас 50 в год — пересмотрите дизайн)?
Если хотя бы на один вопрос ответ «нет» — остановитесь и пересчитайте. Месяц на планирование сэкономит год на переделках.
Заключение
Выборка в 100 пациентов — не магическое число. Она может быть достаточной для сильного эффекта и катастрофически малой для слабого. Единственный способ узнать наверняка — рассчитать объём ДО начала сбора данных на основе размера эффекта, уровня значимости и требуемой мощности.
Если вы уже собрали данные и сомневаетесь в их достаточности — закажите аудит выборки. Мы проведём power analysis, покажем, какие тесты «потянет» ваша база, и подскажем, как усилить дизайн без повторного набора пациентов.
Напишите нам — разберём вашу таблицу за 24 часа и дадим чёткий план действий.