Найти в Дзене
Art of Data&Statistics

Все показатели Описательной статистики, которые могут быть реализованы в программе Statistica: "Меры местоположения или центрированности"

Напомню, что при расчёте Описательных статистик в базовом варианте в Statistica мы пользуемся вкладкой Quick. И там по умолчанию мы можем рассчитать следующие показатели: ValidN, Mean, Median, Mode вместе с Frequency of Mode, Minimum&Maximum, Standard Deviation.

-2

Их и многие другие мы можем увидеть, перейдя на следующую вкладку, Advanced (Расширенные настройки):

-3

Вкладка Advanced используется для расчёта подробного перечня показателей Описательной статистики. Находясь на этой вкладке, можно отметить галочкой все показатели, или сделать это с помощью нажатия кнопки Select all stats. Снять галочки со всех показателей можно с помощью кнопки Reset. Мы можем в принципе выделить нужные нам показатели и сохранить именно их отмеченные для последующего использования. Для этого существует кнопка Save settings: as default.

-4

Итак, рассмотрим, что значит каждый из представленных здесь показателей Описательной статистики.

Первый столбик представляет собой "Меры местоположения или центрированности" ("Location, valid N").

Из этих мер в Statistica отсутствует только математическое ожидание. Но имеется:

1. Количество значений переменной (Valid N).

2. Среднее арифметическое (Mean) — сумма значений переменной, деленная на N (число значений переменной).

3. Сумма значений (Sum) - просто сумма всех значений переменной.

4. Медиана (Median) - средняя точка распределения. Она разбивает выборку на две равные части: половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например, при описании доходов населения, медиана более удобна, чем среднее.

Пример: рассмотрим две выборки.

-5

Количество значений переменной в первой выборке - 7; во второй - 12. Среднее в первой выборке - 16,29; во второй - 53,5.
Сумма значений в первой выборке - 114; во второй - 642. Чтобы найти медиану, следует проранжировать выборку от большего значения к меньшему. В нашем примере обе выборки уже проранжированы. Так как в первом случае
Valid N = 7, то есть нечётное, мы просто находим и указываем в качестве медианы центральное значение переменной - 15. Во втором случае Valid N = 12, оно чётное. В этом случае мы находим два центральных значения переменной, и указываем в качестве медианы их среднее арифметическое. В нашем примере это 45,5.

!В некоторых случаях, например, при описании доходов населения, медиана более удобна, чем среднее!

5. Мода (Mode) представляет собой максимально часто встречающееся значение переменной.

Пример: рассмотрим уже знакомую нам таблицу с базовыми расчётами Описательных статистик для "Эритроцитов":

-6

Наиболее часто встречаемый показатель числа эритроцитов в 10 12(степ)/л крови - 3,9 (Mode = 3,9). В выборке из 28 пациентов это число мы видим 6 раз: Частота моды (Frequency of Mode) = 6.

!Если распределение имеет несколько мод, то говорят, что оно мультимодально. Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-либо, то мультимодальность может означать, что существует несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной!

6. Среднее геометрическое (Geom. mean, Хg ). Это корень той степени, сколько имеется чисел из их произведения.

Формула среднего геометрического.
Формула среднего геометрического.

Пример: среднее геометрическое чисел 2, 4 и 6 будет n (или Хg) = 4.

-8

7. Среднее гармоническое (Harm. mean, Хh ). Его можно определить следующим образом: пусть даны положительные числа от Х1 до Хn, тогда их средним гармоническим будет такое число H, что:

Формула среднего гармонического.
Формула среднего гармонического.

То есть, среднее гармоническое – это обратная величина к среднему от обратных к числам от Х1 до Хn.

Пример: среднее гармоническое чисел 3, 4 и 6 будет h (или Хh) = 4.

-10

Второй столбик представляет собой «Меры разброса» (Variations, moments); Третий столбик - это так называемые «Меры размаха» (Percentiles, ranges).

-11

Суммируя сказанное, просто рассчитаем все описанные показатели автоматически для нашей переменной "Эритроциты". Отметим их галочками во вкладке Advanced, нажмём кнопку Summary, и получим таблицу.

-12