Найти тему

Variance в Статистике простыми словами

Фото: @aaronphs
Фото: @aaronphs

Дисперсия случайной величины (σ2 , s2 , Var(x)) – мера удаленности того или иного значения Выборки (Sample) от Среднего значения (Mean). Рассчитывается с помощью формулы:

-2

Пример. Друзья измерили рост своих собак разных пород и хотят выяснить, у скольких собак слишком большой и слишком маленький рост.

-3

Для начала найдем среднее арифметическое:

Теперь, с добавлением среднего, восприятие точек немного изменится:

-4

Чтобы вычислить дисперсию, выясним разность между каждым элементом выборки и средним значением:

-5

Выполнив подстановку, мы получим значение дисперсии – ~21 тысячу:

Чтобы решить основную задачу, извлечем из этой цифры квадратный корень и получим тем самым Стандартное отклонение (Standard Deviation):

-6

Теперь мы знаем, какое отклонение от среднего значения является нормой, а какое – нет:

-7

Выходит, что из всей выборки очень высоким и очень низким ростом обладают две собаки.