Найти тему
PSTAT / Статистика

Что такое ложные корреляции и почему надо о них помнить

Удивительно, но продажи японских машин в США и число суицидов на автомобилях (когда человек сознательно разбивается на машине) в США же имеют очень высокий показатель корреляции - 93.5%!

Источник: https://www.tylervigen.com/spurious-correlations
Источник: https://www.tylervigen.com/spurious-correlations

Есть множество других примеров: потребление курицы и импорт нефти, возраст мисс Америка и убийства паром и горячими объектами, и много-много других. Объединяет их то, что, с одной стороны, корреляции тут правда высокие. С другой же стороны, считать что японские автомобили вызывают самоубийства или люди, огорчившись что мисс Америка слишком старая, идут друг друга убивать паром - как минимум странно. Просто так случайно совпало что два показателя независимо друг от друга меняются одинаково

Такие штуки называются ложными корреляциями и их, на самом-то деле, очень много.

К чему мы это? Ну, если кто-то показывает вам картинку и говорит что "смотри как связаны эти две штуки" - подумайте, правда ли там должна быть связь или может так случайно совпало?..