Найти в Дзене
Дмитрий Сафронов

Что такое доверительные интервалы в статистике?

Статистика - это нечто среднее между математикой и вероятностью. Смысл статистики в том, чтобы описать процессы, которые вы можете наблюдать в мире — высоту дубов или вероятность того, что вакцина будет работать, чтобы отразить болезнь, — без необходимости измерять каждый дуб в мире или вакцинировать каждого человека, прежде чем решить, насколько эффективен препарат.
Поскольку вероятность
Оглавление

Статистика - это нечто среднее между математикой и вероятностью. Смысл статистики в том, чтобы описать процессы, которые вы можете наблюдать в мире — высоту дубов или вероятность того, что вакцина будет работать, чтобы отразить болезнь, — без необходимости измерять каждый дуб в мире или вакцинировать каждого человека, прежде чем решить, насколько эффективен препарат.

Поскольку вероятность описывает вещи, связанные со случайностью, мы должны признать, что какой бы процесс мы ни измеряли с помощью статистики, мы никогда не получим полной картины.

Зачем Использовать Статистику?

Предположим, вы подбрасываете монету четыре раза. У тебя три головы и один хвост. Не используя статистику, мы могли бы сделать вывод, что вероятность получить Орел составляет 75 процентов, где реальная вероятность получить орел в броске монеты составляет 1:1, или 50-50 шансов. Если бы мы вместо этого сделали 40 подбрасываний монет, мы, безусловно, приблизились бы к соотношению 1:1 "орел-решка", и использование статистики отразило бы это.

"Большая часть статистики связана с рассуждениями от выборки — фактических наблюдений — до характеристик популяции — всех возможных наблюдений", - говорит Джон Дрейк, профессор-исследователь Центра экологии инфекционных заболеваний университета Джорджии, в электронном письме. - Например, нас может заинтересовать высота дубов. Мы не можем измерить все дубы в мире, но мы можем измерить некоторые. Мы можем рассчитать среднюю высоту дубов в выборке, но это не обязательно будет то же самое, что среднее значение для всех дубов."

Доверительные Интервалы

Поскольку мы не можем измерить все дубовые деревья в мире, статистики придумывают расчетный диапазон высот, основанный на вероятности и всех данных, имеющихся в их распоряжении. Этот диапазон называется доверительным интервалом и состоит из двух чисел: одного, которое, вероятно, меньше истинного значения, и одного, которое, вероятно, больше. Истинная ценность, вероятно, находится где-то посередине.

"95-процентный доверительный интервал означает, что в 95 из 100 случаев, когда доверительный интервал строится таким образом, интервал будет включать истинное значение", - говорит Дрейк. "Если бы мы измерили образцы дубов 100 раз, доверительный интервал, основанный на данных, собранных в 95 из этих экспериментов, включал бы среднее значение популяции или среднюю высоту всех дубов. Таким образом, доверительный интервал является мерой точности оценки. Оценка становится все более точной по мере того, как вы собираете больше данных. Вот почему доверительные интервалы становятся меньше по мере поступления большего количества данных."

Таким образом, доверительный интервал помогает показать, насколько хороша или плоха оценка. Когда мы подбрасываем монету всего четыре раза, наша оценка 75% имеет широкий доверительный интервал, потому что наш размер выборки очень мал. Наша оценка с 40 подбрасываниями монет имела бы гораздо более узкий доверительный интервал.

Фактическое значение доверительного интервала связано с повторением эксперимента снова и снова. В случае четырех подбрасываний монет 95-процентный доверительный интервал означает, что если мы повторим эксперимент с подбрасыванием монет 100 раз, то в 95 из них наша вероятность получить Орел будет находиться в пределах этого доверительного интервала.

Пределы статистики

Статистика имеет свои пределы. Вы должны разработать хорошее исследование — статистика не может сказать вам ничего такого, о чем вы не спрашивали.

Допустим, вы изучаете эффективность вакцины, но не включили в исследование детей. Вы можете придумать доверительный интервал, основанный на собранных вами данных, но он ничего не скажет вам о том, насколько хорошо вакцина защищает детей.

"В дополнение к достаточному количеству данных, образец также должен быть репрезентативным", - говорит Дрейк. "Обычно это означает наличие случайной выборки или стратифицированной случайной выборки. Если предположить, что 1000 участников гипотетического испытания вакцины представляют население, то разумно сделать вывод, что истинная эффективность вакцины находится в пределах указанного доверительного интервала. Если выборка не репрезентативна — если в нее не входят дети, — то нет статистической базы для того, чтобы делать выводы о непредставленной части населения."