Все примеры в этой статье приводятся на основе данного файла
Прежде всего необходимо разобраться чем отличаются эти статистические величины и почему говорят, что "Можно утонуть в ручье средней глубиной 30 сантиметров"
Наиболее наглядно это видно в Excel. Предположим у нас есть выборка из 30 работников. Все работники или еще студенты на подработке, или молодые специалисты, то есть их возраст колеблется от 18 до 24 лет.
Размах - это разница между минимальным и максимальным значением. В этом случае она равна 6. Мы видим, что среднее значение, медиана и мода в данном случае практически равны.
Начнем с моды - мода это то значение которое встречается чаще всего. В нашем случае 22 года встречается 6 раз - именно поэтому мода равна 22
Мод может быть несколько, если бы 20-ти летних было бы на одного больше в выборке было бы две моды - 20 и 22 года. Мода - это всегда одно из существующих значений. Если величина измеряется кратно одному году, то и мода - будет в целых годах. 23 с половиной быть не может.
Средняя величина - понятие, знакомое со школы. Надо взять сумму всех возрастов и разделить на количество работников. обычное среднее арифметическое. Именно поэтому здесь появляются дробные числа 20,733.
Медиана. Самое простое, определение - это "честная средняя величина", Но в математике нет такого понятия. Почему честная ? как ее считать ?
Необходимо выстроить всех работников в один ряд по возрастанию их возраста от молодых к более старшим и найти середину этого ряда. Это и есть медиана. То есть это граница раздела. У нас 30 работников значит середина будет 15 или 16 (на Ваше усмотрение)
21 год - это середина ряда. Ряд считаем по количеству участников, а не по сумме лет сверху и снизу от медианного значения. Все работники выше медианного будут иметь возраст равный или меньше, а все кто ниже равный или больше. Медиана, также как и мода - это всегда одно из существующих значений.
Внесем "смуту" и покажем почему медиана - это честное среднее. предположим что несколько молодых людей уволились и на их место пришли пенсионеры (то есть люди старше 65 лет), они тоже готовы работать на невысокую зар.плату, поэтому этот уровень оклада их устроил.
Что изменилось:
- размах - разница между самым молодым и самым старым работником теперь 57 лет
- ушел один 22-х летний, и мода стала равна 20 годам, так как теперь таковых 5 человек
- средний возраст прыгнул на 5 лет вверх (всего из-за 3-х человек - 10% от выборки)
- но медиана - осталась неизменной и именно медианный возраст, показывает реальное положение с возрастом в компании.
Возвращаемся к основной теме урока - как это все посчитать в SPSS
Все делается буквально в пару щелчков мыши. Все о чем писали выше - это описательные статистики, а именно частотный анализ
Переносим необходимые переменные из левого окна в правое и нажимаем кнопку "Статистики"
Выбираем необходимые виды статистики и нажимаем "Продолжить". Возвращаемся в предыдущее окно и нажимаем "Ок". Открывается окно вывода, где самое первое окно - это посчитанные величины: Среднее, Медиана, Мода и Размах.
Вторая таблица результат частотного анализа, но что это и чем процент отличается от валидного процента и накопленного процента поговорим в следующий раз. Для закрепления темы предлагаю повести аналогичные расчеты но уже с заработной платой.
С уважением и готовностью к сотрудничеству, Ваш профессор
#SPSS #СПСС #Excel #Статиситка