Сегодня мы разберем один из самых удивительных и, на первый взгляд, парадоксальных эффектов в статистике – парадокс Симпсона. Этот парадокс показывает, что тренды, наблюдаемые в отдельных группах данных, могут исчезать или даже менять направление, если объединить все группы вместе. Это не просто математическая загадка – парадокс Симпсона может вводить в заблуждение аналитиков, ученых, маркетологов и врачей, приводя к неправильным выводам. Разберем, как он работает, на реальных примерах. Парадокс Симпсона – это явление, при котором тренд, наблюдаемый в отдельных группах, исчезает или меняет направление, если объединить все группы вместе. Другими словами, локальные данные могут показывать одну картину, а агрегированные – совсем другую! Этот эффект впервые описал британский статистик Эдвард Симпсон в 1951 году. Однако сам парадокс был известен и раньше – его замечали еще в 19 веке при анализе медицинских и социальных данных. В 1973 году в США разразился скандал:
Университет Беркли обвинял