Листала на днях книгу "Практическая статистика для специалистов Data Science" (кстати, отличный справочник, чтобы быстро освежить в памяти забытую тему), и наткнулась на выделенный когда-то тезис: "Если мучить данные слишком долго, то рано или поздно они дадут признательные показания". Кажется, лучше и не скажешь. Особенно сейчас, когда доступность инструментов для работы с big data и обучающих курсов по data science нагоняет магический флер на анализ данных сродни гаданию на кофейной гуще: вот у нас хаос из крупиц кофе, размазанных по дну чашки, и вдруг (конечно не вдруг, а если долго-долго смотреть) там проступает силуэт... В общем, пример из этой книги настолько емкий и показательный, что не могу им не поделиться (далее цитата). Если вы определяете гипотезу и проводите хорошо проработанный эксперимент с целью ее проверки, то можете быть уверенными в выводе. Однако зачастую, вместо этого смотрят на имеющиеся данные в попытке разглядеть регулярности. Но является ли регулярность реальн