В данной статье я хочу рассказать о неправильной постановке статистических данных, которые все встречают в СМИ. Самый простой пример – это средняя зарплата в РФ. В марте 2020 года средняя зарплата в РФ по данным Федеральной службы государственной статистики составляет 50 926 рублей. Эти данные рассчитываются по следующей формуле:
Несомненно, это важный показатель для статистических данных, для составления рейтингов между странами, регионами и т.п. Но, обычный гражданин может сказать, что ни у себя, ни у других своих друзей и знакомых не видел такую высокую зарплату. Моя цель донести, опять же примерные данные, но более точные «осязаемые» для обычного человека.
Отвлечёмся от средней зарплаты и посмотрим простой пример: у 9-ти девушек из 10 по одному ребёнку, у последней 11 детей. Получается, что в среднем на каждую девушку приходится по 2 ребёнка. Опять же, если рассматривать фертильность для сравнения с другими странами и регионами эти данные верные, но мы видим, что усреднённые данные отличаются от настоящих, причём сильно. Я же хочу предложить для большего понимания разделение на 2 доли по большей и меньшей группе. То есть в нашем примере будет правильно сказать, что 90% девушек имеют по одному ребёнку, а 10% девушек из данной группы имеют 11 детей.
Теперь вернёмся к заработной плате.
У Росстата нет выборки по всем зарплатам работников, поэтому приведу такой пример: цех на заводе из 100 человек, где 80 человек – это рабочие, а 20 человек – руководящий состав цеха. Средняя зарплата рабочих, например, будет 25 000, а зарплата руководителей 154 630 рублей. Средняя зарплата всего цеха 50 926 рублей.
Суть предложенного метода проста: разбиваем данные на явное большинство и меньшинство. Такой вариант наиболее удобный для усваивания информации, можно увидеть картину более полно при этом не вдаваясь в лишние подробности.