Сегодня мы поговорим о еще одной коварной статистической ловушке — ошибке смещения отбора (selection bias). Это когда данные, которые мы анализируем, не являются репрезентативными, но мы все равно на их основе делаем выводы. Примеров этой ошибки — масса. Она встречается в опросах, исследованиях, аналитике бизнеса и даже в медицинских тестах. В 1948 году в США на выборах президента столкнулись Гарри Трумэн и Томас Дьюи. Газета Chicago Daily Tribune на основе опросов спрогнозировала победу Дьюи и даже напечатала огромный заголовок на первой полосе: "Dewey Defeats Truman" ("Дьюи победил Трумэна"). Но случился конфуз: Трумэн выиграл! Что пошло не так? Смещение отбора! Опрос проводился по телефону, а в 1940-е годы телефоны были дорогими, и в основном ими пользовались богатые республиканцы. Бедные, рабочие и фермеры (которые голосовали за демократов) просто не попали в выборку. То есть, ошибка была в том, что исследователи не учли всех избирателей. Допустим, вы проводите опрос среди своих кл