Найти тему

Голая статистика

Оглавление

№26 (352 стр) Чарльз Уилан "Голая статистика"

#1mlnpages

А вам знакома такая шуточная история: "Ивановы кушают мясо, а их соседи Петровы - капусту. В среднем семьи Ивановых и Петровых едят голубцы". Это я к тому, что умело пользуясь цифрами, количественными характеристиками объектов исследования, можно представить данные с нужного ракурса. Еще хуже, если мы с вами этот ракурс не понимаем и соглашаемся с представленным материалом. И это скорее всего не проблема статистики как таковой, ее методологии. С ней, как раз, все в порядке.

Уилан приводит такой пример, в том числе относящийся к области статистики: ТОП-5 самых кассовых фильмов всех времен на внутреннем рынке США по состоянию на 2011 год выглядит так:

1. Аватар (2009)

2. Титаник (1997)

3. Темный рыцарь (2008)

4. Звездные войны. Эпизод IV (1977)

5. Шрек 2 (2004)

Ничего не смутило? А это реальные статистические данные! Только вот в номинальном выражении, без учета того, что деньги имеют разную покупательную способность в разные временные периоды. Другими словами, на одну и туже денежную единицу (100 рублей или 100 долларов, не важно) можно купить разное количество одного и того же товара сегодня и 10 лет назад.

Так вот, с учетом приведения покупательной способности денег к одному знаменателю ТОП-5 фильмов выглядит следующим образом:

1. Унесенные ветром (1939)

2. Звездные войны. Эпизод IV (1977)

3. Звуки музыки (1965)

4. Инопланетянин (1982)

5. Десять заповедей (1956)

Ответ на вопрос, зачем составляют такие списки в номинальном, а не в реальном выражении, по всей видимости, уже лежит в области маркетинга ;) И кстати "Аватар" в таком рейтинге только на 14 месте.

Признаюсь, это книга не погрузит вас в статистику, не сделает вас экспертом, наверное ее задача - познакомить с азами данной предметной области. Иногда приводятся очень интересные примеры и интуитивно понятное объяснение. Например, книга расскажет о том, что кроме такого показателя, как среднее значение, есть еще и медиана, которая призвана описать схожие процессы, но более применима при больших разбросах данных. Сейчас поясню...

Представьте, что в простое кафе где-то в Омске, в котором отдыхают после трудовой недели обычных 12 посетителей, заходит Роман Абрамович. Так вот, средний доход посетителей кафе будет примерно на уровне 70 млрд, а медианный доход - примерно 30 тыс. Как говорится, почувствуйте разницу!

-2

Несмотря на то, что автор указывает и всячески подчеркивает на протяжении всей книги, что его произведение есть "самая интересная книга о самой скучной науке", я бы поспорил на счет формулировки. На мой взгляд лучше подойдет - " местами самая интересная книга о самой скучной науке" ;)

Сегодня проблем со сбором данных нет, информация размножается с неведомой скоростью, мы ее сами генерируем постоянно. На мой сугубо личный взгляд, более важным вопросом является то, как ей воспользоваться и для чего. Мало применить продвинутые статистические методы, их результаты еще нужно правильно интерпретировать.

Субъективная оценка: 7,85/10

P.S.

Друзья, присоединяйтесь к ЧЕЛЛЕНДЖУ #1mlnpages

Будем вместе читать в 2020 году!