12 подписчиков

Почему ваша выборка в 100 пациентов может оказаться бесполезной?

25 апреля25 апр

4 мин

Вы обошли три отделения, потратили месяцы на сбор анкет, свели данные в таблицу — и отправили рукопись в журнал. Ответ рецензента приходит через шесть недель: «Статистически незначимо. Недостаточный объём выборки». Как такое возможно, если вы собрали сто пациентов? Главная ошибка: выборка «сколько успели» В 87% диссертаций, которые мы аудируем, объём выборки взят «с потолка»: «Успели собрать 100 человек за полгода — значит, хватит». Это не методология — это лотерея. Размер выборки рассчитывается ДО начала исследования на основе трёх параметров: 🔸 Ожидаемый размер эффекта — насколько сильно различаются группы (например, снижение давления на 10 мм рт. ст. или на 2 мм рт. ст.) 🔸 Уровень значимости α — вероятность ложноположительного результата (обычно 0,05) 🔸 Мощность исследования (1−β) — вероятность обнаружить эффект, есл и он есть (стандарт 80%) Если эффект слабый, а выборка маленькая — даже реальное различие между группами останется «статистически незначимым». Вы потратили год на

Главная ошибка: выборка «сколько успели»

В 87% диссертаций, которые мы аудируем, объём выборки взят «с потолка»: «Успели собрать 100 человек за полгода — значит, хватит». Это не методология — это лотерея. Размер выборки рассчитывается ДО начала исследования на основе трёх параметров:

🔸 Ожидаемый размер эффекта — насколько сильно различаются группы (например, снижение давления на 10 мм рт. ст. или на 2 мм рт. ст.)

🔸 Уровень значимости α — вероятность ложноположительного результата (обычно 0,05)

🔸 Мощность исследования (1−β) — вероятность обнаружить эффект, есл

и он есть (стандарт 80%)

Если эффект слабый, а выборка маленькая — даже реальное различие между группами останется «статистически незначимым». Вы потратили год на сбор данных впустую.

Пример из практики: когда 100 пациентов — это мало

Кардиолог исследовал два метода контроля гипертонии. Набрал по 50 человек в каждую группу (всего n=100). Различие в среднем систолическом давлении составило 8 мм рт. ст., стандартное отклонение — 15 мм рт. ст. Применил t-критерий Стьюдента — получил p=0,09. Незначимо.

Мы провели post-hoc power analysis: при таких параметрах мощность исследования составила всего 52% — то есть шанс обнаружить реальный эффект был равен подбрасыванию монетки. Для мощности 80% требовалось минимум 94 пациента на группу (всего 188 человек).

Автор дополнил выборку данными из архива клиники, довёл до n=200 — и получил p=0,031. Статья прошла рецензию с первого раза.

Как правильно рассчитать выборку: п

ошаговая инструкция

Шаг 1. Определите дизайн исследования.

РКИ, когорта, случай-контроль, одна группа до/после? От этого зависит формула расчёта.

Шаг 2. Укажите ожидаемый размер эффекта.

Опирайтесь на литературу: какие различия показывали похожие исследования? Если данных нет — закладывайте средний эффект (Cohen's d ≈ 0,5).

Шаг 3. Задайте уровни α и β.

Стандарт: α=0,05 (вероятность ошибки I рода 5%), β=0,2 (мощность 80%). Для более строгих требований (например, скрининговые тесты) можно взять β=0,1 (мощность 90%) — но выборка вырастет на 30–40%.

Шаг 4. Рассчитайте минимальный объём.

Используйте калькуляторы (G*Power, R-пакет «pwr») или формулы для конкретного критерия. Например, для сравнения двух средних:

n = 2 × (Zα + Zβ)² × σ² / Δ²,

где Δ — ожидаемое различие, σ — стандартное отклонение.

Шаг 5. Заложите запас на выбывание.

Если ожидаете 10% пот

ерь при наблюдении — увеличьте расчётный объём на 10–15%.

Больше примеров и методик вы найдёте на сайте https://statobrabotka.ru — там же можно заказать расчёт выборки под ваш дизайн.

Когда 100 пациентов достаточно — а когда нет

Выборка в 100 человек может быть адекватной, если:

🔸 Эффект сильный (например, различие групп >1 стандартного отклонения)

🔸 Вы сравниваете бинарные исходы с частотой событий >20% в обеих группах

🔸 Используете парные дизайны (до/после на одних и тех же пациентах)

Но если эффект слабый (Что делать, если выборка уже собрана — и она мала?

1. Проведите post-hoc power analysis: оцените,

какова была реальная мощность вашего теста. Если >70% — можно указать в ограничениях исследования и идти дальше.

2. Объедините данные с другими центрами (мультицентровое исследование) или используйте архивные базы клиники.

3. Смените дизайн на более мощный: вместо независимых групп — парный анализ; вместо t-теста — регрессия с ковариатами (ANCOVA).

4. Если ничего не помогает — честно укажите недостаточную мощность как limitation и опубликуйтесь в журнале с меньшим импакт-фактором.

Подробные разборы таких кейсов и обсуждение методов публикуем в нашей группе ВКонтакте: https://vk.com/centerstatresearch — присоединяйтесь, чтобы не пропустить новые материалы.

Чек-лист перед стартом исследования

Прежде чем собирать первую анкету, проверьте:

☑ Есть ли обоснование объёма выборки (формула, ссылка на калькулятор, цитата из методической литературы)?

☑ Указаны ли α, β, ожидаемый размер эффекта?

☑ Учтён ли запас на выбывание

и отказы?

☑ Совпадает ли расчёт с дизайном (не взяли формулу для РКИ в наблюдательном исследовании)?

☑ Реалистичен ли объём для вашей клиники (если формула требует 500 пациентов, а у вас 50 в год — пересмотрите дизайн)?

Если хотя бы на один вопрос ответ «нет» — остановитесь и пересчитайте. Месяц на планирование сэкономит год на переделках.

Заключение

Выборка в 100 пациентов — не магическое число. Она может быть достаточной для сильного эффекта и катастрофически малой для слабого. Единственный способ узнать наверняка — рассчитать объём ДО начала сбора данных на основе размера эффекта, уровня значимости и требуемой мощности.

Если вы уже собрали данные и сомневаетесь в их достаточности — закажите аудит выборки. Мы проведём power analysis, покажем, какие тесты «потянет» ваша база, и подскажем, как усилить дизайн без повторного набора пациентов.

Напишите нам — разберём вашу таблицу за 24 часа и дадим чёткий план действий.

Бизнес и финансы

1,13 млн интересуются