При анализе данных самое простое – это обнаружить корреляцию между двумя случайными величинами. Но для полноценного анализа нужно еще уметь правильно интерпретировать эту корреляцию, т.е. понять и объяснить, каким образом эти величины взаимосвязаны друг с другом. В этом и состоит искусство аналитика. Само по себе наличие положительной корреляции еще не означает, что мы обнаружили причинно-следственную связь. Корреляция двух величин может свидетельствовать о наличии ОБЩЕЙ ПРИЧИНЫ, хотя сами эти величины напрямую не взаимосвязаны. «Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанёс пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «увеличение количества пожарных приводит к увеличению причинённого ущерба», и тем более не будет успешной попытка минимизировать ущерб от пожаров путём ликвидации пожарных бригад». (Елисеева, Юзбаше
Наука о данных: о чем может говорить корреляция?
16 августа 202016 авг 2020
185
3 мин