Найти тему
a.sushchikh

Меры изменчивости, дисперсия

Размах — разность между максимальным и минимальным значением в распределении.

Дисперсия — Средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия показывает, насколько в среднем наши значения отклоняются от среднего значения в выборке.

Рассчитывается дисперсия так:

  • получаем среднее значение для выборки
  • рассчитываем, насколько каждый элемент отклоняется от среднего значения, возводим это в квадрат (чтобы поменять знак для отрицательных отклонений)
  • суммируем эти средние отклонения, делим на количество элементов выборки минус 1 (n-1)

Стандартное отклонение (sd) более правильный параметр, представляет собой квадратный корень из дисперсии. Поскольку квадрат нужен, чтобы избавляться от отрицательных значений, нужно этот квадрат корнем убрать.

Пример:

есть выборка из семи элементов: 1, 2, 2, 3, 4, 4, 5
среднее значение для нее = 3
рассчитаем для каждого элемента отклонение от среднего и возведем в квадрат
(1-3)**2 = 4
(2-3)**2 = 1
(2-3)**2 = 1
(3-3)**2 = 0
(4-3)**2 = 1
(4-3)**2 = 1
(5-3)**2 = 4
Сумма отклонений = 12, количество элементов 7
Таким образом дисперсия = 12/(7-1) = 2
Сигма, или стандартное отклонение = 1.41