Добавить в корзинуПозвонить
Найти в Дзене

Круг чтения. ДЭРРЕЛЛ ХАФФ «Как лгать при помощи статистики»

Знаете это чувство, когда читаешь рекламу: «85% стоматологов рекомендуют нашу пасту» - и хочется сразу бежать в магазин? Или слышишь по телевизору: «Средняя зарплата по региону - 75 тысяч рублей» и думаешь: «Где-то я не там живу?». Поздравляю, вы только что столкнулись с великим и ужасным - статистикой, которая умеет лгать, не сказав ни слова неправды. Даррелл Хафф написал эту книгу в 1954 году, и с тех пор её тиражи перевалили за миллионы. Она переведена на десятки языков, включая китайский, и до сих пор остаётся обязательным чтением для всех, кто не хочет, чтобы из него делали идиота. Ирония судьбы: даже на обложке красуется надпись «продано свыше 7 миллиардов экземпляров» - и это уже само по себе издевательская иллюстрация к теме книги.
Хафф начинает с классической цитаты Бенджамина Дизраэли, которую потом подхватил Марк Твен: «Существуют три вида лжи: ложь, наглая ложь и статистика». И весь текст - это подробный разбор того, как именно цифры могут врать, оставаясь формально честны

Знаете это чувство, когда читаешь рекламу: «85% стоматологов рекомендуют нашу пасту» - и хочется сразу бежать в магазин? Или слышишь по телевизору: «Средняя зарплата по региону - 75 тысяч рублей» и думаешь: «Где-то я не там живу?». Поздравляю, вы только что столкнулись с великим и ужасным - статистикой, которая умеет лгать, не сказав ни слова неправды.

Даррелл Хафф написал эту книгу в 1954 году, и с тех пор её тиражи перевалили за миллионы. Она переведена на десятки языков, включая китайский, и до сих пор остаётся обязательным чтением для всех, кто не хочет, чтобы из него делали идиота. Ирония судьбы: даже на обложке красуется надпись «продано свыше 7 миллиардов экземпляров» - и это уже само по себе издевательская иллюстрация к теме книги.

Хафф начинает с классической цитаты Бенджамина Дизраэли, которую потом подхватил Марк Твен: «Существуют три вида лжи: ложь, наглая ложь и статистика». И весь текст - это подробный разбор того, как именно цифры могут врать, оставаясь формально честными.

Автор не пытается очернить статистику как науку. Он просто предупреждает: любую количественную величину можно выразить множеством способов. Вы можете назвать доходность продаж в 1%, а можете - рост прибыли на 40% по сравнению с 1935–1939 годами. И то, и другое - правда. Но впечатление - разное.

Первый и самый мощный инструмент манипуляции - это нерепрезентативная выборка. Хафф разбирает классический пример: журнал Time опубликовал данные, что средний выпускник Йельского университета 1924 года зарабатывает $25 111 в год.

Цифра впечатляет. Но кто попал в выборку? Только те выпускники, чьи адреса удалось найти (то есть успешные, у которых есть постоянное жильё) и те, кто согласился заполнить анкету (то есть те, кому не стыдно за свои доходы). Алкоголики, безработные художники и просто стеснительные бедняки в статистику не попали. Вывод: выборка изначально смещена в сторону благополучных.

Особенно это заметно в опросах. Хафф напоминает историю 1952 года, когда опрос по телефону дал неверный прогноз выборов - потому что телефоны тогда были только у зажиточных людей, которые голосовали за определённую партию. Сегодня, кстати, та же проблема с онлайн-опросами.

В школе нас учили: среднее - это сумма, делённая на количество. Хафф объясняет, почему этого недостаточно. Есть три вида среднего:
Среднее арифметическое - сумма, делённая на число.
Медиана - значение ровно посередине списка.
Мода - самое часто встречающееся значение.
И все они могут давать совершенно разные числа для одного набора данных. Если Билл Гейтс зайдёт в бар, средний доход посетителей взлетит до космических высот, хотя все остальные останутся такими же, как были. Медиана и мода этого эффекта не покажут, но кто ж вам их покажет?

Доверительные интервалы: Маленькая деталь с большими последствиями
Хафф рассказывает историю про тест IQ: у одного испытуемого 98 баллов, у другого 101. На первый взгляд, второй умнее. Но если посмотреть на полную запись: 98 ± 3 и 101 ± 3, становится ясно, что разница вообще ни о чём не говорит .

Или про сигареты: одна марка оказалась на последнем месте по содержанию вредных веществ. С отрывом в сотые доли процента. Производитель запустил рекламную кампанию: «Old Gold содержит меньше всего вредных веществ!». Формально - правда. По сути - издевательство .

Отдельная любовь Хаффа - графики. Если сжать шкалу по оси Y, рост в 4% можно визуально превратить в 400%. Если убрать числовые метки - вообще можно нарисовать что угодно .

А инфографика - это отдельный вид искусства. Хафф показывает пример с двумя мешками денег: если одна зарплата больше другой в два раза, дизайнер сделает второй мешок в два раза выше и шире. А поскольку мешок трёхмерный, визуально он будет казаться больше в ВОСЕМЬ раз. Newsweek всегда так делает.

Хафф предупреждает о ложных корреляциях. То, что две вещи происходят одновременно, ещё не значит, что одна вызывает другую. Статистики называют это «спутанными переменными». Простой пример: количество пожарных на пожаре и размер ущерба коррелируют положительно. Но пожарные не создают ущерб - просто на большие пожары вызывают больше пожарных.

В конце книги автор даёт пять простых вопросов, которые нужно задавать любой статистике:
Кто это говорит? (Есть ли у источника скрытая заинтересованность?)
Откуда ему это известно? (Какова выборка? Достаточно ли она велика и случайна?)
Чего не хватает? (Может быть, умолчали о разбросе данных или о размере выборки?)
Не подменён ли объект исследования? (Вместо реальных фактов нам показывают чьё-то мнение?)
Есть ли в этом смысл? (Включаем здравый смысл - не слишком ли цифра хороша, чтобы быть правдой?)

Книгу часто ругают за то, что она устарела и описывает Америку 1950-х. Но методы манипуляции не меняются. В эпоху «больших данных» и бесконечных опросов, где каждый второй сайт выдаёт «рейтинги» и «топы», книга Хаффа остаётся актуальной как никогда.

P.S. Хафф был не только статистиком, но и журналистом, автором книг о ведении домашнего хозяйства и редактором журналов . Его обвиняли в связях с табачными компаниями - якобы он высмеивал заявления про вред курения в своих книгах в их пользу. Правда это или нет - вопрос. Но если даже так, он знал тему манипуляций не понаслышке.

ОТКРЫТ НАБОР НА КУРС "РОМАН"
СЛЕДУЙТЕ ЗА БЕЛЫМ КРОЛИКОМ!

Ваш М.