Найти в Дзене
Репетитор IT men

✏️ Как пишутся научные работы

Поговорим о том, о чем говорить не принято, о чем молчат и чего, как будто бы, не замечают. Об обратной стороне науки. Давайте сразу оговоримся: пост не является обобщением ни в коем случае. Просто открывает другую сторону медали. Именно истинной науке и нужно доверять. Но всегда ли наука содержит правду? 🧠 Псевдоинтеллектуал // @pseudo_i @ Выкидываешь «аномальные» данные, потому что они «явно ошибочные» и портят красивый график). @ Подбираешь параметры модели до тех пор, пока p-value не становился волшебным числом меньше 0.05. @ Объясняешь расхождение с теорией «особыми условиями эксперимента», которые почему-то не были описаны в методе. @ Ощущаешь не стыд, а гордость за то, что всё ловко сошлось, а на горизонте маячит звание д. ф. - м. наук. Мы создали целую культуру, где главное — это красивый, «чистый» результат, упакованный в стройную теорию. А сам процесс поиска истины — этот грязный, хаотичный, с кучей несостыковок — превратился в постыдный секрет, который прячут в папке «сырые
Оглавление

Поговорим о том, о чем говорить не принято, о чем молчат и чего, как будто бы, не замечают. Об обратной стороне науки. Давайте сразу оговоримся: пост не является обобщением ни в коем случае. Просто открывает другую сторону медали. Именно истинной науке и нужно доверять. Но всегда ли наука содержит правду?

🧠 Псевдоинтеллектуал // @pseudo_i

Как пишутся научные работы ?

@ Выкидываешь «аномальные» данные, потому что они «явно ошибочные» и портят красивый график).

@ Подбираешь параметры модели до тех пор, пока p-value не становился волшебным числом меньше 0.05.

@ Объясняешь расхождение с теорией «особыми условиями эксперимента», которые почему-то не были описаны в методе.

@ Ощущаешь не стыд, а гордость за то, что всё ловко сошлось, а на горизонте маячит звание д. ф. - м. наук.

Мы создали целую культуру, где главное — это красивый, «чистый» результат, упакованный в стройную теорию. А сам процесс поиска истины — этот грязный, хаотичный, с кучей несостыковок — превратился в постыдный секрет, который прячут в папке «сырые_данные_версия_42_финальная_точно».

Самая большая ирония? Эти самые работы, отполированные до блеска, потом с гордостью публикуются, цитируются, и на них строят новые теории. Мы строим карьерные пирамиды на фундаменте из ниток.

И ладно бы это была простая халтура. Нет! Это возведено в ранг интеллектуального мастерства. Умение «видеть, что здесь нужен иной критерий» или «интерпретировать этот выброс как системную ошибку» — это же признак глубокого понимания, да?

Вопрос знатокам: Мы стали лучше подгонять данные или просто стали более изощрённо оправдывать это перед собой?

P.S. Если вы никогда так не делали — моё восхищение. А если делали, но теперь морщитесь при воспоминании — возможно, в вас ещё жив учёный.

Ещё разочек простыми словами. Представьте, что вы проверяете, работает ли новое удобрение. У вас две грядки: одна с удобрением, другая — без. В конце сезона вы сравниваете урожай. P-value — это, грубо говоря, вероятность того, что разница между грядками получилась случайно.

◼ P-value = 0.8 (80%) → Очень высокая вероятность, что вам просто повезло, и удобрение на самом деле бесполезно. Разница — случайность.

◼ P-value = 0.05 (5%) → Вероятность, что разница случайна, уже мала. Учёные договорились считать это порогом: «Хм, похоже, удобрение и правда работает!».

◼ P-value = 0.001 (0.1%) → Крайне малая вероятность, что это случайность. Очень сильные доказательства в пользу удобрения.

Учёный годами корпит над теорией, что его удобрение — прорыв. Он проводит эксперимент, а p-value получается 0.06 или 0.1. По всем правилам, надо честно сказать: «Статистически значимого эффекта не обнаружено».

Но вместо этого начинается «творчество»:

1. «Чистка данных»: «А этот куст на опытной грядке явно болел — уберём его из расчётов. И вот этот на контрольной — слишком большой, наверное, ошибка». После удаления «выбросов» p-value волшебным образом падает до 0.04.

2. Перебор условий: Считаем разницу не по килограммам, а по количеству плодов. Не подходит? Считаем по среднему весу одного плода. И так до тех пор, пока в одной из десятка проверок p-value не станет «правильным».

3. Манипуляция выборкой: «Давайте разделим растения не на две группы, а на три: слабые, средние, сильные. И о, чудо! Среди средних растений p-value наконец-то 0.03!» — и отчёт пишется только про эту подгруппу.

Учёный получает заветный p < 0.05, публикует статью о «сенсационном открытии», гордится работой. Но по сути, он не обнаружил эффект, а создал его статистическими ухищрениями, выдав случайную флуктуацию данных за истину.

Именно это и называется «подгонять данные, чтобы теория сошлась с практикой». Цель смещается с правильной = «проверить гипотезу» на ложную = «получить любой ценой красивое число p < 0.05».

Обсуждение в telegram-канале