Итак, коллеги, некоторые комментаторы при первых признаках снижения кривой заражения по России поторопились заявить, что в России пик пройден и омикрон пошел на спад. На самом деле это все либо малоопытные, либо тенденциозные комментаторы (а чаще всего - и то, и другое). Настоящее снижение по числу заражений случилось в Москве, а не в регионах РФ. Если не учитывать Москву в статистике по регионам, то кривая по регионам еще даже на высокое плато не вышла...
Но... что обращает на себя внимание? - Еще одна уже известная закономерность: при снижении числа заражений растет смертность. Эта тенденция уже проявилась в Москве. Омикрон оказался коварен тем, что тяжелое течение проявляется не сразу, а спустя 2-3 недели.
Напоминаю, что я публикую графики в данном случае, как и практически всегда, с опорой на вполне официальную статистику, собранную на Яндексе по данным российских штабов по борьбе с коронавирусом.
Почему я всерьез отношусь к статистическим данным? Повторяю для тех, кто все еще твердит, что "статистика - это супер-наглая ложь". Да, искажений много, но большинство этих искажений являются РАЗНОНАПРАВЛЕННЫМИ (в одних организациях статистику занижают, в других - завышают). Поэтому тенденции отследить можно, ибо разнонаправленные искажения нейтрализуют друг друга. И это показала практика анализа предыдущих волн коронавируса, которая неплохо переносится на текущую пятую волну.
Так что... как говорится, "нет худа без добра". Плохо, что омикрон оказался таким заразным и повлек за собой столь массовую эпидемию. Но... зато больше людей теперь начинают больше доверять статистике, ибо впервые за время пандемии личные впечатления от эпидемии (по числу зараженных и заболевших знакомых) стали совпадать с данными официальной статистики...
На третьем графике видим данные на сегодняшний день - на 9 февраля (они публикуются, как правило, в районе 11.00-12.00). Как я и предполагал, тенденция снижения по РФ оказалась неустойчивой. Сегодня имеем очередной "антирекорд" - свыше 183 тысяч человек.
АРТЕФАКТ САМООРГАНИЗУЮЩЕЙСЯ ВЫБОРКИ
Большинство читателей, как я теперь знаю, только в связи с пандемией стали интересоваться рядом непонятных статистических процессов и парадоксов на "больших выборках", на социально-демографических выборках. Поясню, как работает один из самых известных артефактов, связанных с массовыми опросами. В ряде трудов (главным образом зарубежных социальных психологов) этот эффект назван "эффект нормальных добровольцев". Мне кажется, что более понятное название - "эффект самоорганизующейся выборки".
Недавно по ТВ-каналу "Россия 24" объявили результаты опроса полутора тысяч (примерно 1500) телезрителей канала. Вопрос был поставлен примерно так: "Заразились ли Вы коронавирусом в текущей волне (омикроном) и, если заразились, как тяжело у Вас протекала болезнь". Как Вы думаете, сколько ответили, что они лично заразились и болезнь у них протекает (протекала) ТЯЖЕЛО? - Таких оказалось почти 11% респондентов. Довольно много! Явно больше того, что мы наблюдаем вокруг себя. Даже цифры официальной статистики по числу госпитализированных не превышают, насколько я в курсе, 7% (хотя надо учитывать, что знаменатель дроби в этом случае занижен, так как не все зараженные сделали официальный ПЦР в нашей стране; так что будем думать, что не менее 30-50 процентов не сделали). Видимо, реальные цифры по доле людей с тяжелым течением находятся в районе 3 процентов. Ну... или никак не выше 5%. Откуда же берутся 11% в ходе телевизионного опроса? Или это был опрос на сайте телекомпании, кажется.
Все дело в том, что люди принимают решение об участии в большинстве опросов ДОБРОВОЛЬНО и при этом у разных людей мотивация на участие оказывается разной силы - у кого-то сильней, а у кого-то слабей. Общая известная закономерность заключается в том, что сильней мотивация участия оказывается у людей, которые по данной теме оказались сильней вовлечены - пережили значимое событие в своей личной жизни. Вот поэтому в таких опросах более активно участвуют ... "тяжело поболевшие", и в результате доля тяжелобольных оказывается завышенной.
Такие искажения возникают всегда, когда выборка опрошенных формируется на добровольных началах. Неопытные люди частенько совсем не думают о таких систематических искажениях и принимают результаты за "чистую монету". Если в каком-то другом опросе были сильней мотивированы участники, которые переболели легко (и рвутся получить справки и куар-коды с минимальными затратами личного времени), то в этом другом опросе искажения будут получены в другую сторону. Получается так, что возникают споры между малокомпетентными людьми, которые плохо осознают, что опираются на данные полученные в разных опросах, в которых структура мотивации участия оказалась совершенно различной.
СТРУКТУРА МОТИВАЦИИ ПРИ ДОБРОВОЛЬНОМ ТЕСТИРОВАНИИ НА КОВИД
Конечно, далеко не все проходит у нас в стране ПЦР-тест добровольно. Например, просто вынуждены его проходить туристы, выезжающие из страны. Но доля таких респондентов на фоне глобальной эпидемии (какую принес именно штамм омикрон) не так велика. В основном ПЦР-тест выполняют люди по собственному желанию. К какому же искажению данных приводит этот факт? - К тому, что в структуре выборки тех людей, которые сдали ПЦР-тест несколько преобладают люди: а) более тревожные, б) менее здоровые (не уверенные в собственном иммунитете, часто до этого болевшие), в) с более явными симптомами, более тяжелым течением текущего заболевания. Поэтому официальная статистика по доля тяжелых случаев ВСЕГДА оказывается завышенной. Это понятно?
Пишите в комментариях "+1", пожалуйста, если понятно и Вы согласны с моей аргументацией. Эти такие короткие ваши ответы служат мне моральной поддержкой и очень подкрепляют мои усилия по просвещению широкой публики в области научной методологии социально-психологических исследований. Если же не согласны, то, пожалуйста, давайте развернутую аргументацию, а не простой "полив в адрес автора".