Найти в Дзене
PharmaDataLab

Голая статистика - Чарльз Уилан

Голая статистика - Чарльз Уилан (Naked Statistics - Charles Wheelan) Сегодня хочу поделиться мини рецензией об этой замечательной книге. Заодно ответить на вечный вопрос: может ли книга про статистику быть живой, понятной и не вызывать флэшбеки с пары по матстату. На сайте самого Уилана про него написано коротко и нагло: Author. Professor. Speaker. Political Reformer. Автро явно не из тех, кто открывал статистику только ради сдачи экзамена. И это чувствуется с первых страниц. Я, как человек, который уже много лет живёт в аналитике, BI и моделях, я довольно скептически отношусь к «популярным» книгам по статистике - но тут история другая: «Голая статистика» - это, пожалуй, одна из лучших книг по статистике, которые я читал. А читал я их уже немало - от классики до совсем академического кирпича. О чём книга (и почему это не скучно) • Корреляция • Основы теории вероятностей • Центральная предельная теорема (ЦПТ) • Опросы общественного мнения • Регрессионный анализ На обложке вообще на

Голая статистика - Чарльз Уилан

(Naked Statistics - Charles Wheelan)

Сегодня хочу поделиться мини рецензией об этой замечательной книге.

Заодно ответить на вечный вопрос: может ли книга про статистику быть живой, понятной и не вызывать флэшбеки с пары по матстату.

На сайте самого Уилана про него написано коротко и нагло:

Author. Professor. Speaker. Political Reformer.

Автро явно не из тех, кто открывал статистику только ради сдачи экзамена. И это чувствуется с первых страниц. Я, как человек, который уже много лет живёт в аналитике, BI и моделях, я довольно скептически отношусь к «популярным» книгам по статистике - но тут история другая:

«Голая статистика» - это, пожалуй, одна из лучших книг по статистике, которые я читал.

А читал я их уже немало - от классики до совсем академического кирпича.

О чём книга (и почему это не скучно)

• Корреляция

• Основы теории вероятностей

• Центральная предельная теорема (ЦПТ)

• Опросы общественного мнения

• Регрессионный анализ

На обложке вообще написано:

«Самая интересная книга о самой скучной науке»

И вот тут Уилан делает магию:

он реально разжёвывает статистику так, что и новичку ок, и человеку с опытом есть что подчеркнуть и переосмыслить.

При этом он объясняет сложные вещи на живых примерах:

загадка Монти Холла, Perry Preschool Study, марафон любителей сосисок, супружеская жизнь Ким Кардашьян (да, и она послужила статистике), исследования Americans Changing Lives и многое другое.

Центральная предельная теорема по-человечески

Отдельный кайф книги - блок про выборки, опросы и ЦПТ.

Вот как сам Уилан описывает ЦПТ:

«Центральная предельная теорема, значение которой для статистики соизмеримо со значением Леброна Джеймса для профессионального баскетбола».

Если перевести на практический язык:

если у нас есть правильно сформированная выборка, то наблюдаемые на ней характеристики с высокой вероятностью отражают свойства всей генеральной совокупности.

Несколько цитат, которые показались особенно точными

«Опираясь на статистику, легко врать, но без статистики очень трудно выяснить истину». - Андрейс Дункельс

«Вы не можете управлять тем, что не в состоянии измерить. Помимо этого, то, что вы измеряете, действительно является тем, чем вы пытаетесь управлять».

«Какой бы соблазнительной ни была элегантность и точность вероятностных моделей, они не заменят нам здравого размышления о сути и цели выполняемых вычислений».

И мой любимый образ 🔥:

«Когда увеличивается размер неправильно сформированной выборки, высота мусорной кучи также увеличивается, а вонь от неё становится сильнее».

«Голая статистика» трезво напоминает:

📍 Статистика и анализ данных - это мощный инструмент, чтобы лучше понимать реальность, а не подгонять её под наши фантазии.

📍 Любая модель - всего лишь приближение мира, а не откровение.

📍 Аналитик всегда должен быть не только «человеком формул», но и человеком здравого смысла.

Как я люблю говорить:

мало быть data-driven, важно оставаться data-informed

Как эта книга помогла лично мне

В далёком уже 2019-м я учился на Data Science в Нетологии. Одна из тем была Центральная предельная теорема. Формулы были красивые, преподаватели старались, домашки летели одна за другой - но абсолютно не было понятно, как эту теорему вообще применять в реальной аналитике и зачем она нужна, кроме как для галочки на экзамене.

И вот спустя время попадает мне в руки «Голая статистика».

И Уилан, как настоящий профессор-волшебник, берёт и на примере марафона любителей сосисок(!) объясняет ЦПТ так, что наконец-то становится ясно:

• как она работает

• почему она настолько фундаментальна

• и в каких реальных задачах она решает половину аналитических головоломок.

Так что да - эта книга не только хороша сама по себе,

она ещё и сильно закрывает пробелы, которые другие источники часто оставляют открытыми.