Найти в Дзене
Art of Data&Statistics

Все показатели Описательной статистики, которые могут быть реализованы в программе Statistica: "Процентили и размах" (тоже меры разброса)

Продолжим исследовать вкладку Advanced (Расширенные настройки), которая используется для выбора показателей Описательной статистики (Descriptive Statistics) из его полного перечня. Первый столбец, рассмотренный в одной из предыдущих статей, содержит "Меры местоположения или центрированности": количество значений переменной, среднее арифметическое (а также геометрическое и гармоническое), сумма всех значений переменной, медиана , мода и частота моды. Во втором столбце расположились "Меры разброса" - стандартное отклонение, дисперсия, стандартная ошибка среднего значения, доверительный интервал для среднего значения, асимметрия, стандартная ошибка коэффициента асимметрии, эксцесс, стандартная ошибка коэффициента эксцесса. Третий столбик продолжает обширную тему разброса данных, и обозначается "Процентили и размах", если дословно переводить его заглавие... Разберём подробно представленные здесь показатели Описательной статистики. В качестве примера используем таблицу с гемограммами 28 па

Продолжим исследовать вкладку Advanced (Расширенные настройки), которая используется для выбора показателей Описательной статистики (Descriptive Statistics) из его полного перечня. Первый столбец, рассмотренный в одной из предыдущих статей, содержит "Меры местоположения или центрированности": количество значений переменной, среднее арифметическое (а также геометрическое и гармоническое), сумма всех значений переменной, медиана , мода и частота моды. Во втором столбце расположились "Меры разброса" - стандартное отклонение, дисперсия, стандартная ошибка среднего значения, доверительный интервал для среднего значения, асимметрия, стандартная ошибка коэффициента асимметрии, эксцесс, стандартная ошибка коэффициента эксцесса. Третий столбик продолжает обширную тему разброса данных, и обозначается "Процентили и размах", если дословно переводить его заглавие...

Basic Statistics - Descriptive Statistics, вкладка Advanced программы Statistica.
Basic Statistics - Descriptive Statistics, вкладка Advanced программы Statistica.

Разберём подробно представленные здесь показатели Описательной статистики. В качестве примера используем таблицу с гемограммами 28 пациентов, которая уже рассматривалась для расчёта других Описательных статистик.

Гемограмма 28 пациентов.
Гемограмма 28 пациентов.

Рассчитаем все показатели из колонки "Процентили и размах" автоматически для переменной "Эритроциты" (столбец Е). Отметим их галочками во вкладке Advanced, нажмём кнопку Summary, и получим таблицу.

-4

Описание и интерпретация:

1. Минимум и максимум (Minimum & Maximum). Здесь всё просто - это минимальное значение выборки и максимальное значение выборки.

Для Эритроцитов: Minimum = 3,3, Maximum = 4,3.

2. Минимальная и максимальная квартили (Lower & upper quartiles). Вспомним, что медиана делит выборку на две половины. А квартили делят верхнюю и нижнюю часть выборки ещё раз пополам! Различают верхний квартиль (Upper quartile), который больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижний квартиль (Lower quartile), который меньше медианы, и делит пополам нижнюю часть выборки.

Для данного ряда цифр медиана составляет 5,5, нижний квартиль - 3, верхний квартиль 7.
Для данного ряда цифр медиана составляет 5,5, нижний квартиль - 3, верхний квартиль 7.
  • Нижний квартиль часто обозначают символом 25%, или Р25, это означает, что 25% значений переменной меньше нижнего квартиля.

Для Эритроцитов: Р25 = 3,65.

  • Верхний квартиль часто обозначают символом 75%, или Р75, это означает, что 75% значений переменной меньше верхнего квартиля.

Для Эритроцитов: Р75 = 4,00.

3. Процентные точки (Percentile boundaries) - значения процентилей, которые задаёт пользователь. На практике чаще всего используют процентили: Р3, Р97 ; Р10, Р90. Нетрудно догадаться, что 25й и 75й процентили - это не что иное, как нижний и верхний квартиль соответственно.

Процентиль (Percentile) — это статистическая мера, указывающая значение, которое заданная случайная величина не превышает с указанной вероятностью. Например, фраза «Р97 или 97-й процентиль равен 15» означает, что 97% всех измеренных величин не достигает значения 15 и только 3% всех измеренных величин превышает это значение.

Процентили часто используются в педиатрии для оценки многих антропометрических показателей детей. Со статистическими данными ВОЗ других детей сопоставляются вес, рост и окружность головы детей разного возраста.

Центильная таблица по весу (мальчики).  На пересечении осей абсцисс (возраст ребёнка, мес) и оси ординат (масса тела, кг) находим нужный процентиль и интерпретируем его. Например, 15-й процентиль массы тела (в 9ти месячном возрасте это будет 8 кг) означает, что мальчик тяжелее, чем 15% других мальчиков и легче 85% других мальчиков.
Центильная таблица по весу (мальчики). На пересечении осей абсцисс (возраст ребёнка, мес) и оси ординат (масса тела, кг) находим нужный процентиль и интерпретируем его. Например, 15-й процентиль массы тела (в 9ти месячном возрасте это будет 8 кг) означает, что мальчик тяжелее, чем 15% других мальчиков и легче 85% других мальчиков.

В Statistica есть возможность настроить две Percentile boundaries, воспользовавшись выпадающим списком First (значение по умолчанию 10,00%) и Second (значение по умолчанию 90,00%). Не будем пока менять эти значения.

Для Эритроцитов: Р10 = 3,40 и Р10 = 4,1.

4. Размах (Range). Тут тоже всё просто: размах - это разница между наибольшим и наименьшим значением переменной.

Для Эритроцитов: Range = 1,00.

5. Квартильный (внутриквартильный) размах (Quartile Range) равен разности значений верхнего и нижнего квартиля. Таким образом, это интервал, содержащий медиану, в который попадает 50% наблюдений.

Для данного ряда цифр квартильный размах составляет: Q3 - Q1 = 7 - 3 = 4.
Для данного ряда цифр квартильный размах составляет: Q3 - Q1 = 7 - 3 = 4.

Для Эритроцитов: Quartile Range = 0,35.