77,2 тыс подписчиков

Не стоит доверять статистике, она часто врет.

2 минуты

2546 прочтений

17 декабря 2023

Иногда я пишу: "Согласно голландскому бюро статистики то или сё". На самом деле, безоговорочно я не доверяю никакой статистике. Хотя, многие считают, что статистические данные это такой островок правды среди океана лживой информации.

В- принципе, можно подтасовать любую цифру под линию партии, чаяния народа и т.д. и т.п. Не стоит доверять никакой статистике на 100%, она частенько лукавит. Есть даже книга Дарелла Хаффа "Как лгать при помощи статистики". Почитайте, если интересно. Можно сформировать трезвый взгляд на окружающие нас цифры.

Некоторые цифры статистики у меня вызывают вопрос: кто, как и по каким критериям измерил эту цифру? И многие мои читатели тоже недоумевали когда я писала, что голландские дети признаны самыми счастливыми в мире. Кто и где разработал критерий счастья?

Как-то мне попалась статья из PNAS. Это ведущий американский журнал для публикации оригинальных научных исследований в различных областях.Так вот, они проводили исследования "Придут ли разные исследователи к схожим выводам при анализе одних и тех же данных"?

Семьдесят три независимые исследовательские группы использовали идентичные данные для проверки известной гипотезы социальных наук: увеличение иммиграции приведет к снижению общественной поддержки государственной социальной политики.

Вместо совпадения результаты команд сильно различались, варьируясь от большого негативного до большого положительного влияния иммиграции на поддержку социальной политики. Причина тому — процедура составления выборки, а именно на основе выборок и формируют цифры статистической отчетности.

Допустим, у вас есть мешок, в котором вперемешку красная и белая фасоль. Чтобы узнать сколько какой, логично вывалить все из мешка и пересчитать. Но это муторно, поэтому идут по более простому пути: зачерпывают пригоршню и считают сколько какой фасоли в ладошке, исходя из предположения, что они в одинаковой пропорции.

А как проводят социальные опросы? Вот вам, предположим, поручили задать ряд вопросов прохожим на улице. Идут навстречу два человека, которые подходят под категорию, которую нужно опросить. Только один прохожий опрятно одет и улыбчив, а второй одет черти как и угрюм. К кому подойдет интервьюер? А потом напечатают цифру, что такой-то процент населения улыбчив.

Статистика только кажется объективной и беспристрастной. "Цифры не лгут" и прочая. Но они получаются на анализе данных. А результат анализа зависит во многом от того кто и как анализирует данные. Анализ данных - это не всегда математический расчет, при котором результат каждый раз один и тот же.

Очень интересный показатель как рассчитывается уровень бедности в Нидерландах. Чтобы узнать, беден ли человек, берут его "располагаемый доход", который представляет собой доход, остающийся после вычета налогов и страховых взносов, но не после вычета обязательного погашения долга. Если этот доход не ниже черты бедности, то он не беден.

Но, оказывается, Центральное статистическое бюро (CBS) не учитывает долги: задолженность по арендной плате, медицинской страховки, счетов за коммунальные услуги и муниципальные налоги. Центральное бюро не располагает данными по задолженности населения, но рисует цифру, что население стало беднее, но совсем чуть-чуть.