Найти тему
Факторы смысла

Как из-за спекулятивной интерпретации статистики рождаются... пугающие мифы

Итак, читаем очередной пугающий заголовок:

"Медленный темп ходьбы в четыре раза увеличивает риск смерти от COVID-19"


https://yandex.ru/news/story/Medlennyj_temp_khodby_vchetyre_raza_uvelichivaet_risk_smerti_otCOVID-19--fd1e571010e85c406f1d988676cd0343?lang=ru&rubric=personal_feed&fan=1&stid=tq-eZXP1h9ar3bhb3FSG&t=1615971418&tt=true&persistent_id=135637965&fbclid=IwAR0N8ken6rU2iOq83HWvDEWHbpak-AKs_rXUXFAqZWia-ukAdWN0uRd4Yj0

Женщина еще улыбается, а мужчина... уже при смерти, так как идет очень медленно.
Женщина еще улыбается, а мужчина... уже при смерти, так как идет очень медленно.



Вы согласны с тем, что слово "увеличивает" несет в себе такой смысл, что "медленная ходьба" является причиной повышения риска смерти? Если так, то Вам будет интересно почитать мое опровержение.

Немного занудства на тему "Научный подход к статистической связи"

Иногда корреляцию (статистическую связь) между двумя переменными А и В , которые обе зависят от третьей причины С, называют ЛОЖНОЙ корреляцией. Но это, на мой взгляд, просто некорректный термин. Надо просто отделять саму корреляцию и ее причинностную интерпретацию: сама плотность статистической связи является симметричной функцией и НЕ несет информацию о том, что на что влияет. Она дает лишь только возможность строить три разных причинных гипотезы:

- А влияет на В,
- В влияет на А,
- есть третья переменная С, которая влияет на А и В.

Впрочем, возможен и четвертый случай (который в классической интерпретации редко используется). Этот четвертый случай называется КРУГОВАЯ КАУЗАЛЬНОСТЬ: А влияет на В, а В, в свою очередь, тоже влияет на А. Но мы его оставим в стороне. Итак...

Слово "увеличивает" - это чтобы проще было понять

Итак, в процитированном сенсационном заголовке про "медленную ходьбу" мы находим еще один забавный казус (слово "забавный" использую здесь в качестве мрачного юмора). Не подвергаю сомнению, что между темпом ходьбы и смертностью есть связь, но уверен, что и на тот, и на другой показатель действует в качестве причины некая третья переменная С.

Но... такой способ интерпретации статистической связи никак не закрепляется в умах. Почему это важно? - Ну хотя бы потому, что воздействие на производную переменную А (темп ходьбы) при таком понимании причины НЕ может изменить значение переменной В (смертность), ибо непосредственной причинной зависимости В от А вовсе нет никакой. А так ведь подумают, что "буду-ка я ходить быстрей" и ... снизится вероятность летального исхода в случае заболевания ковид-инфекцией. А как назвать переменную С? - Очевидно, что это называется "общая ослабленность организма".

...А может быть, и не слишком это удачный случай для иллюстрации? Ведь увеличение темпа ходьбы (в разумных пределах) может дать определенный тренировочный эффект и защитные возможности организма увеличатся на самом деле... Но все равно заметно, что паника перед КОВИДом привлекла внимание совсем ничего не смыслящих в статистике журналистов к интерпретации разных статистических зависимостей.

....впрочем, некоторые журналисты ставят своей сознательной целью повысить "кликабельность" своих публикаций именно с помощью...нагнетания панических страхов.

Телепрограмма "ВРЕМЯ" - тоже "причина" смертности?

Я готов поспорить на 100 рублей, что можно доказать следующую страшную зависимость: "От КОВИДА умирают в три раза больше тех людей, кто смотрит по телевизору программу ВРЕМЯ" (по сравнению с теми, кто ее не смотрит). Понятное дело, третья переменная С - это в данном случае большой возраст, в котором людям труднее отказаться от привычек, сформированных десятилетиями - смотреть новостные программы по телевизору. Дело в возрасте, а не в программе ВРЕМЯ, как мы понимаем.

Есть лож, наглая ложь и ... статистика (вместо заключения)

Так что... в известной циничной фразочке про "наглую ложь и статистику" есть доля правды. Но целесообразно различать 2 разных методах, создания лжи с помощью статистики:

1) Первый прием - организовать искаженный сбор информации. Например, можно привлечь к опросу только запуганных (а смелых не привлекать вовсе) и они точно дадут "нужную информацию" - о том, что их спасают от невиданной смертельной болезни только маски, перчатки и прививки.

2) Второй прием - можно действовать по-другому: выявить ложную корреляция и тенденциозно начать интерпретировать эту связь как причину страшной, огромной, пугающей... СМЕРТНОСТИ (!).