Данные часто бывают неполными. В клинических испытаниях пациенты могут выбывать, респонденты пропускать вопросы в опросах, а школы и правительства — скрывать определённые результаты. Когда отсутствуют данные, стандартные статистические методы, такие как вычисление средних, становятся неэффективными. «Мы не можем работать с отсутствующими данными так же, как не можем делить на ноль», — поясняет Стеф ван Бюрен, профессор из Университета Утрехта. Представьте, что вы тестируете препарат для снижения давления. Вы собираете данные еженедельно, но часть участников уходит из исследования, разочарованные отсутствием улучшений. Можно исключить этих участников из анализа, оставив только тех, кто закончил исследование — это называется полным анализом случая. Однако это создаёт ошибку: исключение недовольных пациентов искажает результаты, заставляя лечение выглядеть более эффективным, чем оно есть на самом деле. Избежать такой предвзятости сложно. Ранее исследователи применяли разные техники с серь
Множественное вменение: как догадки о недостающих данных меняют наук
7 октября 20247 окт 2024
1074
3 мин