Хочу затронуть тему корреляций. Смотрите, часто можно встретить такое утверждение: А коррелирует с Б. И у простого читателя складывается ощущение, что А и Б взаимосвязаны и взаимозависимы. Но это не так. Покажем на примере. Когда мы говорим о зависимостях, проще всего представить некоторую функцию, например, y(x) или f(x).
Здесь все однозначно, для каждого значения по оси абсцисс есть некоторое значение по оси ординат, эти две величины взаимосвязаны. Графики могут быть любыми: гиперболическими, параболическими или полиномиальными, это не так важно. А важно, что есть четкая и однозначная взаимосвязь между x и y.
А что с корреляцией? А для корреляции нельзя нарисовать такой график, то есть четкой взаимосвязи между двумя (или больше) величинами нет, но есть некоторая доля взаимозависимости. Эта доля обозначается коэффициентом корреляции. Он может быть от -1 до 1, ну или от -100% до 100%. Когда коэффициент корреляции равен отрицательному числу, говорият об обратной корреляции, когда положительному - о прямой. Чем ближе коэффициент к 1 (ну или -1), тем ближе корреляция к зависимости, в частности линейной, о которой мы говорили выше.
Естественно, когда коэффициент корреляции равен 0, то нет никакой корреляции, но часто мы встречаем ситуацию, когда он равен 0,6 или 0,7. В таком случае о четкой зависимости говорить нельзя, а слово корреляция иногда может вводить в ступор. Например, можно написать, что "британские ученые установили корреляцию между количеством лягушек и вероятностью заболеть ОРВИ". И можно заявить, что лягушки связаны с ОРВИ, и подобных "исследований" в сегодняшней науке целая гора. Будьте внимательнее. Посмотрите на забавные корреляции ниже.