Размах — разность между максимальным и минимальным значением в распределении.
Дисперсия — Средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия показывает, насколько в среднем наши значения отклоняются от среднего значения в выборке.
Рассчитывается дисперсия так:
- получаем среднее значение для выборки
- рассчитываем, насколько каждый элемент отклоняется от среднего значения, возводим это в квадрат (чтобы поменять знак для отрицательных отклонений)
- суммируем эти средние отклонения, делим на количество элементов выборки минус 1 (n-1)
Стандартное отклонение (sd) более правильный параметр, представляет собой квадратный корень из дисперсии. Поскольку квадрат нужен, чтобы избавляться от отрицательных значений, нужно этот квадрат корнем убрать.
Пример:
есть выборка из семи элементов: 1, 2, 2, 3, 4, 4, 5
среднее значение для нее = 3
рассчитаем для каждого элемента отклонение от среднего и возведем в квадрат
(1-3)**2 = 4
(2-3)**2 = 1
(2-3)**2 = 1
(3-3)**2 = 0
(4-3)**2 = 1
(4-3)**2 = 1
(5-3)**2 = 4
Сумма отклонений = 12, количество элементов 7
Таким образом дисперсия = 12/(7-1) = 2
Сигма, или стандартное отклонение = 1.41