Найти тему

30.Средняя зарплата, Чукотка и Абрамович

С клюкой - точно пенсионерка.
С клюкой - точно пенсионерка.

Это байка, которую я рассказывал своим студентам на лекциях по статистике. С её помощью хочу проиллюстрировать мои методические приёмы.

Предположим, на Чукотке стоит посёлок, состоящий из одного чума. В этом чуме живут пять чукотских пенсионеров. Как водится, ждут рассвета.

Допустим, пенсии у них такие: 5300, 6700, 6800, 7000 и 8000 в месяц. Цифры взял такие, чтобы не отвлекать публику на нематематические подробности.

Средний ежемесячный доход в этом «поселке» 6760руб.

И вот, в это посёлок, по своим избирательным делам прописывается Абрамович. А у него ежемесячный доход 6 000 000руб. И теперь средний доход в поселке уже чуть более 1 000 000руб!

В качестве вывода цитирую высказывание Дизраэли про ложь, наглую ложь и статистику. Публика соглашается, но говорит: «Да это было и так понятно!»

Тогда я задаю вопрос: «А что вы можете предложить вместо среднего арифметического, чтобы статистика верно отразила существо вопроса?»

Как правило, в ответ молчание.

Тогда в качестве объективной меры я предлагаю медианный доход. До регистрации Абрамовича медианный доход в посёлке был 6800руб. Это медиана – число, стоящее посередине в упорядоченном ряду.

После регистрации Абрамовича ряд стал таким: 5300, 6700, 6800, |7000, 8000, 1 000 000. Здесь уже медиану нужно вычислять как среднее арифметическое чисел, стоящих по краям черты, делящей ряд пополам. Это (6800+7000)/2. Как видим, после регистрации Абрамовича медианный доход в посёлке изменился незначительно, стал 6900.

После этого я ставлю вопрос так: «А почему же тогда все считают среднее арифметическое?»

Дружный ответ: «Жулики!»

А вот и нет, говорю я и предлагаю найти медиану неупорядоченного ряда из 11 чисел. Народ пыхтит. А я прерываю пыхтение и рассказываю об алгоритмах ранжировки. Не подробно, а просто очерчиваю проблему. И указываю, как просто можно пересчитать среднее для N+1 числа, если оно уже посчитано для N чисел. После этого рассказываю про интердецильный размах, цензурированное усреднение, и прочие дела, связанные с мерами положения и разброса.

Слежу, чтобы на это ушло не более 20 минут. Через 20 минут, примерно, достигается точка потери интереса. (Этому учил Известный лектор из МГУ Козаржевский. Нагуглите его книжки –получите много полезных советов по лекторскому мастерству.)

После 20мин. рассказываю какой-либо случай из жизни, имеющий отношение к статистике, или просто анекдот. Потом делаю выводы из сказанного мной и начинаю задавать вопросы на закрепление услышанного. Эти вопросы обязательно должны зависеть от уровня аудитории, от того, как прилежно слушали. Ну, например, предлагаю посчитать интердецильный размах ряда из 10 чисел и его цензурированное среднее.

Разность между указанными столбиками составляет интердецильный размах
Разность между указанными столбиками составляет интердецильный размах

Вопросы мне можете задавать комментариях, или в ВК http://vk.com/eugene_dudnik. Если наберется 20 одинаковых вопросов, напишу статью. Близкие по тематике мои статьи №8 и №19.