Найти в Дзене

Минутка математики. Коэффициент корреляции

Коэффициент корреляции показывает наличие и силу линейной (!) связи двух переменных. Корреляция это ковариация двух переменных, деленная на произведение их стандартных отклонений. p = Kxy/ (n*∂x, ∂y) (1) , где Кxy – коэффициент ковариации случайных величин X, Y ∂x, ∂y – стандартные отклонения случайных величин X, Y n – число значений ряда Иногда показатель срабатывает там, где нет прямых логических связей. Например, статистические данные о количестве нападений акул и продажи мороженого имеют положительную связь. Оба ряда зависят от температуры окружающей среды. Чем она выше, тем больше купальщиков и покупателей мороженого. Но этот третий параметр сразу не очевиден. Временами совпадения и вовсе случайны или находятся в нелинейной зависимости. Поэтому желательно дополнять корреляцию здравым смыслом и альтернативными расчётами. Если линейная зависимость не найдена используют метод парных регрессий. Существует так же множественная корреляция n-нного числа переменных. Значения коэффиц

Коэффициент корреляции показывает наличие и силу линейной (!) связи двух переменных.

Корреляция это ковариация двух переменных, деленная на произведение их стандартных отклонений.

p = Kxy/ (n*∂x, ∂y) (1) ,

где Кxy – коэффициент ковариации случайных величин X, Y

∂x, ∂y – стандартные отклонения случайных величин X, Y

n – число значений ряда

Иногда показатель срабатывает там, где нет прямых логических связей. Например, статистические данные о количестве нападений акул и продажи мороженого имеют положительную связь. Оба ряда зависят от температуры окружающей среды. Чем она выше, тем больше купальщиков и покупателей мороженого. Но этот третий параметр сразу не очевиден. Временами совпадения и вовсе случайны или находятся в нелинейной зависимости. Поэтому желательно дополнять корреляцию здравым смыслом и альтернативными расчётами. Если линейная зависимость не найдена используют метод парных регрессий. Существует так же множественная корреляция n-нного числа переменных.

Значения коэффициента корреляции расположены в интервале -1<= p <=1

p = 1 Линейная функциональная зависимость – одному значению переменной соответствует одно единственное значение функции. И наоборот. Например радиус при расчёте длины окружности.

p= -1 Обратная линейная функциональная зависимость. При увеличении одной переменной вторая обязательно пропорционально уменьшается.

p= 0 означает отсутствие линейной зависимости между переменными

По шкале Чеддока значения коэффициента корреляции интерпретируются так:

От 0 до 0,3 — очень слабая.

От 0,3 до 0,5 — слабая.

От 0,5 до 0,7 — средняя.

От 0,7 до 0,9 — сильная (высокая).

От 0,9 до 1,0 — очень сильная (очень высокая).

Пример 1

Предположим, что доход компании (Х) в зависимости от ситуации на рынке может принимать значения 1 млн. руб. с вероятностью 0,5, 2,5 млн. руб. с вероятностью 0,3 и 5 млн. руб. с вероятностью 0,2.

Затраты компании на рекламу (Y) могут принимать значения 0,1 млн. с вероятностью 0,6, 0,3 млн. с вероятностью 0,3 и 0,5 млн. с вероятностью 0,1.

Рассчитайте корреляцию Х и У

Вычислим математическое ожидание дохода.

М(X) = 1*0,5+2,5*0,3+5*0,2=2,25 млн.

Найдем отклонения Х от математического ожидания

1-2,25 = -1,25

2,5-2,25 = 0,25

5-2,25 = 2,75

Вычислим математическое ожидание расходов на рекламу

M (Y) =0,1*0,6+0,3*0,3+0,5*0,1= 0,2 млн.

Найдем отклонения У от математического ожидания

0,1-0,2=-0,1

0,3-0,1=0,1

0,5-0,2=0,3

Kxy =((-1,25*-0,1)+(0,25*0,1)+(2,75*0,3))/(3-1) = 0,4875

Рассчитаем квадрат математического ожидания дохода.

М(X)^2 = 2,25^2=5,0625

Вычислим математическое ожидание квадрата дохода.

M(X^2) =1*0,5+2,5^2*0,3+5*5*0,2=7,375

Определим дисперсию ряда

D(X) = 7,375-5,0625=2,3125

Вычислим среднее квадратическое отклонение

s(X)= √2,3125 = 1,5207

Рассчитаем квадрат математического ожидания расходов на рекламу.

М(Y)^2 = 0,2^2=0,04

Вычислим математическое ожидание квадрата дохода.

M(Y^2) =0,1^2*0,6+0,3^2*0,3+0,5^2*0,1= 0,058 млн.

Определим дисперсию ряда

D(Y) =0,058-0,04=0.018

Вычислим среднее квадратическое отклонение

s(Y)=√0,018 =0,1341

Определим коэффициент корреляции

p = 0,4875/(1,5207*0,1341*3)=0,8

В рассматриваемом примере связь между переменными сильная.