28 апреля 2022 года в журнале Nature вышла такая статья, что только матом, только матом. Но увы, ученым нужно держать себя в руках. Статью эту уже 5 мая пометили, как неблагонадежную, потому что очень большое количество ученых нашли нестыковки в дизайне модели, в выборках и использованных методах анализа. Давайте переведем с английского на русский язык, а потом с русского на понятный.
И так, сама статья:
В аннотации нам сразу сообщают, что ученые взяли данные Израильской национальной неотложной медицинской помощи (в оригинале сокращается до EMS) с 2019 по 2021 год. Фокус-группой было решено взять возраст 16-39 лет. В качестве исследуемого параметра берут остановки сердца и вызовы скорой помощи при проблемах с сердцем. Ок, поняли, приняли. Идем дальше.
Проблемы начинаются уже в выборке:
1. Ученые взяли данные лишь с 1 января 2019 года, а это значит, что мы сравниваем пандемию с пандемией. Почему бы не взять хотя бы с 2018?
2. Затем данные из EMS и данные по случаям заболевания COVID-19 -это данные по двум разным возрастам. Для переболевших короной были взяты данные по 0-39 годам и натянуты на глобус. В целом, нельзя одну делать анализ одной возрастной группы по данным другой, пусть и перекликающейся с первой. Но в случае с COVID-19 мы знаем зависимость течения заболевания от возраста. Это не научно. Так делать нельзя.
3. Самое важное - в статье нет данных, были ли вакцинированы или болели ли те, кто вызывал неотложку.
Ну а теперь к методу. Сравнение двух этих неправильных выборок было сделано через отрицательную биноминальную регрессию (все, все, больше не буду использовать такие страшные слова). Проблема статистических данных в том, что они дают адекватный результат только, если к ним применить правильный метод. Этот метод слишком простой и не может отразить всю сложность сердечных заболеваний самих по себе. А уж если говорить про связь сердечных заболеваний с COVID-19 по выборке, которую не исправили с учетом количества тестов, сезонности и лок даунов... это все равно, что соотносить зеленое с горьким методом усреднения.
Дальше давайте посмотрим на манипуляции в графиках.
Смотрите, слева по оси Y у нас случаи сердечных проблем. И ось начинается с цифры 4. А справа у нас число вакцинированных. И начинается права ось Y с 0.
Эпидемиолог Gideon Meyerowitz-Katz воспроизвел этот график с правильными осями и драма уже не так пугает:
Все еще есть совпадения в графиках, но если даже такое маленькое изменение ощутимо сдвигает тренды, то что будет, если взять правильную выборку, спросить у людей с проблемами сердца, был ли у них ковид и были ли они вакцинированы? А уж если сравнить их с допандемичными данными, то конкретно этот график можно выкинуть, не разбираясь.
Мне очень нравится второй график, который Gideon Meyerowitz-Katz сделал на основании данных из статьи. По такой логике случаи сердечных заболеваний вызывают первую вакцинацию😅 Видите, сначала идет красный тренд со случаями сердечных проблем, и затем с небольшим опозданием синий с вакцинацией:
Если вы владеете научным и медицинским английским, то я рекомендую вам еще прочитать вот этот разбор. Я старалась дать вам такое объяснение, с которым вы уловите самое важное, обладая базовыми школьными знаниями, и поэтому не стала объяснять методы статистического анализа 🧡
Надеюсь, эта статья успокоила вас и снизила вашу тревожность. Буду благодарна тем, кто дочитал, за лайки и комменты: так вы помогаете мне заработать на новый телефон через популяризацию науки.