Итак, читаем очередной пугающий заголовок:
"Медленный темп ходьбы в четыре раза увеличивает риск смерти от COVID-19"
Вы согласны с тем, что слово "увеличивает" несет в себе такой смысл, что "медленная ходьба" является причиной повышения риска смерти? Если так, то Вам будет интересно почитать мое опровержение.
Немного занудства на тему "Научный подход к статистической связи"
Иногда корреляцию (статистическую связь) между двумя переменными А и В , которые обе зависят от третьей причины С, называют ЛОЖНОЙ корреляцией. Но это, на мой взгляд, просто некорректный термин. Надо просто отделять саму корреляцию и ее причинностную интерпретацию: сама плотность статистической связи является симметричной функцией и НЕ несет информацию о том, что на что влияет. Она дает лишь только возможность строить три разных причинных гипотезы:
- А влияет на В,
- В влияет на А,
- есть третья переменная С, которая влияет на А и В.
Впрочем, возможен и четвертый случай (который в классической интерпретации редко используется). Этот четвертый случай называется КРУГОВАЯ КАУЗАЛЬНОСТЬ: А влияет на В, а В, в свою очередь, тоже влияет на А. Но мы его оставим в стороне. Итак...
Слово "увеличивает" - это чтобы проще было понять
Итак, в процитированном сенсационном заголовке про "медленную ходьбу" мы находим еще один забавный казус (слово "забавный" использую здесь в качестве мрачного юмора). Не подвергаю сомнению, что между темпом ходьбы и смертностью есть связь, но уверен, что и на тот, и на другой показатель действует в качестве причины некая третья переменная С.
Но... такой способ интерпретации статистической связи никак не закрепляется в умах. Почему это важно? - Ну хотя бы потому, что воздействие на производную переменную А (темп ходьбы) при таком понимании причины НЕ может изменить значение переменной В (смертность), ибо непосредственной причинной зависимости В от А вовсе нет никакой. А так ведь подумают, что "буду-ка я ходить быстрей" и ... снизится вероятность летального исхода в случае заболевания ковид-инфекцией. А как назвать переменную С? - Очевидно, что это называется "общая ослабленность организма".
...А может быть, и не слишком это удачный случай для иллюстрации? Ведь увеличение темпа ходьбы (в разумных пределах) может дать определенный тренировочный эффект и защитные возможности организма увеличатся на самом деле... Но все равно заметно, что паника перед КОВИДом привлекла внимание совсем ничего не смыслящих в статистике журналистов к интерпретации разных статистических зависимостей.
....впрочем, некоторые журналисты ставят своей сознательной целью повысить "кликабельность" своих публикаций именно с помощью...нагнетания панических страхов.
Телепрограмма "ВРЕМЯ" - тоже "причина" смертности?
Я готов поспорить на 100 рублей, что можно доказать следующую страшную зависимость: "От КОВИДА умирают в три раза больше тех людей, кто смотрит по телевизору программу ВРЕМЯ" (по сравнению с теми, кто ее не смотрит). Понятное дело, третья переменная С - это в данном случае большой возраст, в котором людям труднее отказаться от привычек, сформированных десятилетиями - смотреть новостные программы по телевизору. Дело в возрасте, а не в программе ВРЕМЯ, как мы понимаем.
Есть лож, наглая ложь и ... статистика (вместо заключения)
Так что... в известной циничной фразочке про "наглую ложь и статистику" есть доля правды. Но целесообразно различать 2 разных методах, создания лжи с помощью статистики:
1) Первый прием - организовать искаженный сбор информации. Например, можно привлечь к опросу только запуганных (а смелых не привлекать вовсе) и они точно дадут "нужную информацию" - о том, что их спасают от невиданной смертельной болезни только маски, перчатки и прививки.
2) Второй прием - можно действовать по-другому: выявить ложную корреляция и тенденциозно начать интерпретировать эту связь как причину страшной, огромной, пугающей... СМЕРТНОСТИ (!).