Новый коронавирус вызвал необычайное возбуждение в обществе, совершенно немыслимое по поводу еждегодных вспышек сезонного гриппа.
Но если уж принимать новую инфекцию всерьез, то имеет смысл предсказывать значения на будущее, что позволит планировать загрузку лечебных учреждений, необходимость внесения ограничительных мер, либо послаблений по мере спада эпидемии.
Развитие эпидемии идет по некоторым правилам, знание которых позволяет если не предсказать точное значение надолго вперед, то хотя-бы сделать оценку дальнейшего хода, внося поправки по степени соответствия вновь поступающих данных прогнозу.
Наша цель – по виду кривых числа ежедневно заболевших оценить, насколько глубоко можно рискнуть прогнозировать, и как это сделать.
Все достаточно просто, если эпидемию смоделировать на лабораторных мышах. Мыши живут в замкнутом пространстве, общаются достаточно равномерно (без самоизоляций и «оспенных» вечеринок), и с некоторой вероятностью друг друга заражают.
Предположим, что в начале эксперимента все мыши здоровы, потенциально заражаемы все (т.е нет мышей с врожденным или приобретенным иммунитетом), от инфекции никто не умирает, а болезнь проходит сама по себе через некоторое время – картина, близкая к сезонному гриппу у людей.
Если подсадить в сообщество 1 инфицированную мышь, через сутки гипотетической болезнью окажутся зараженными 2 мыши. Через 2 суток 4, через 3 суток 8 и т.д. Это так называемый экспоненциальный рост, или рост в геометрической прогрессии. Если продолжать подсчет, то через 10 суток зараженными окажутся 2 в 10-й степени мышей, или 1024 мыши.
Но стоп – в нашем рассаднике мышиной заразы мышей ведь всего 100 – значит ли это, что уже на 6-7 сутки зараженными окажутся все 100 мышей? Никоим образом.
Мы посчитали, что уже на 3 сутки зараженными окажутся 8 мышей, а это означает, что каждая инфицированная мышь будет заражать здоровых уже не так интенсивно, как в первые дни эпидемии, поскольку часть мышей, с которыми входит в контакт инфицированная мышь, уже окажется больной или переболевшей.
Скорость распространения эпидемии, когда каждый день число заболевших удваивается, поддерживается лишь в первые дни, в дальнейшем она спадает.
Для новой коронавирусной инфекции базовый коэффициент распространения (или коэффициент репродукции) равен 2, это означает, что один больной человек заражает за 4 дня двух здоровых. Но, по мере развития эпидемии, коэффициент распространения уменьшается (в отличие от базового, он называется эффективным коэффициентом распространения), увеличение числа ежедневно заболевших идет уже не по экспоненциальной кривой, а по особой колоколообразной кривой, называемой кривой прироста логистической кривой.
Ниже на графике изображена кривая прироста (синей линией), и там же, для сравнения, продолжение развития по экспоненте (красная линия). Развитие по экспоненте так и шло бы с коэффициентом распространения 2 (для ковида-19), но когда популяция распадется в отношении 50/50 (переболело 50%, и 50% еще здоровых), наступает пик, что означает максимальное число заболевших в сутки, а затем оно непрерывно уменьшается.
В начале процесса экспонента и кривая логистического процесса неотличимы, на графике каждые 4 дня значения удваиваются, но затем логистический рост замедляется, в то время как экспонента развивается с прежней скоростью.
На пике эпидемии коэффициент распространения равен строго 1, а за пиком он менее 1, стремясь к завершению процесса к значению, обратном к базовому коэффициенту распространения (для ковида при базовом коэффициенте распространения R=2 эффективный коэффициент распространения стремится к 1/2= 0,5).
В реальности на человеческой популяции такого идеального графика не наблюдается, есть случайные отклонения, наблюдается недельный цикл, к моменту пика переболело не 50% популяции, а меньше, поскольку часть населения не восприимчива к инфекции, кто-то вакцинирован и пр. при этом может сказаться даже вакцинация от иной инфекции, чем распространяемая в данный момент.
Но похожий на идеальный график можно наблюдать при условии жестких применяемых властями мер – карантин зараженной местности/поселения, удержание интенсивности контактов постоянной.
Ниже первая в мире вспышка ковида в Китае, вполне удовлетворительно приближаемая одной логистической зависимостью. Но и меры по пресечению эпидемии в Китае были приняты беспрецедентные.
Черная тонкая линия – фактическое число заболевших, график рваный; здесь, на дзене, мы не раз выкладывали статьи по недельной цикличности ковида, и имеет смысл данные сгладить, устраняя недельный цикл и выявляя тренд, отображенный зеленой линией.
Базовый коэффициент распространения (по красной линии) для данного случая 2,3, в конце эпидемии эффективный коэффициент распространения равен обратному значению, 0,44.
Но слишком жесткие меры чреваты медленным формированием стадного иммунитета (это узаконенный термин, который стыдливо заменяют понятием «коллективного иммунитета»), и инфекция даже после ее полного исчезновения грозит вспыхнуть вновь.
Что же в реальности? Изучать закономерности по данным заболеваемости Москвы нерационально, слишком много испытал этот график на себе внешних регуляторных воздействий, связанных, в частности, с Пасхой и 1 мая.
А вот после классического (нереализуемого на практике) процесса по графику выше стоит взглянуть на график по Италии. Ниже на рисунке число ежедневно заболевших в зависимости от дня развития эпидемии (тонкая черная линия, и сглаженные значения зеленой линией).
График немножко похож на уже понятную нам колоколообразную зависимость, но колокол какой-то скособоченный, правая ветвь (спадающая после пика) гораздо более пологая, чем левая ветвь (растущая до пика). Какое тут может быть объяснение? Да очень простое – люди узнают, что пик пройден, и расслабляются, как по своим понятиям, так и с позволения властей, в расчете на восстановление рухнувшей экономики.
Графики, подобные представленному для Италии, хорошо моделируется суммой двух колоколообразных кривых прироста. На графике это голубая и синяя линии, суммарная линия красная. По модели, весь процесс разбивается на 2 независимых, все население Италии как бы разбито на 2 не контактирующих друг с другом сообщества, в одном из которых эпидемия начинается раньше и протекает быстрее (красная линия), а во втором наступает позднее и протекает медленнее.
Базовый коэффициент распространения по голубой линии 2,2 (что практически совпадает с коэффициентом для Китая!), а эффективный коэффициент распространения в правой части синей линии 0,72, а не 0,46, что следовало бы, если и затухание шло по голубой линии.
По факту, это не соответствует реальному процессу, но позволяет раздельно отследить левую и правую ветви кривой эпидемии, смоделировать разные рост и спад с максимальным приближением к фактическим данным.
Следовательно, после пика, с каждым новым поступлением данных, точность прогноза будет повышаться, поскольку по мере накопления данных по поведению эпидемии на спаде синяя линия будет все точнее отражать конечные стадии эпидемии.
В Италии никакой прогноз уже не нужен, что измениться радикально может лишь с приходом 2-й волны, а к настоящему времени инфекция в основе подавлена.
Но вот по России (без Москвы) пик пройден совсем недавно (11 июня), и появляется возможность прогноза дальнейшего хода эпидемии. Но Россия велика, гораздо больше Италии, и когда в одних субъектах Федерации эпидемия уже практически заглохла, в других она еще в самом разгаре. Здесь уместно моделировать эпидемию 3 колоколообразными кривыми прироста, пример ниже.
Сегодняшний день (30 июня) отмечен желтым маркером. Прогноз не очень благоприятный – весь июль и август число ежедневно заболевших будет исчисляться тысячами. И, поскольку спад лишь наметился, прогноз вперед - дело неблагодарное, значение прогноза на определенную дату вперед будет меняться при каждом поступлении новых данных, но по состоянию на сегодня можно предположить, что 1 августа число заболевших составит не меньше 2000.
Базовый коэффициент распространения самой первой волны (голубой) составляет 2,4 (опять-таки близко к Китаю и Италии, это для ковид-19 универсальное значение в начале эпидемии), эффективный коэффициент распространения в конце эпидемии (по пурпурной кривой) 0,88, что несколько хуже Италии (0,72) и совсем плохо в сравнении с Китаем (0,44).
Причина ясна - в Китае вся инфекция (по представленному графику) была локализована в одной провинции Хубэй и городе Ухани, Италия - маленькая страна, Россия огромная, и при затухании инфекции в одном регионе она только начинает разгораться в другом.
Как видим, прогноз – дело неблагодарное, это что пытаться угадать курс доллара или цену барреля нефти.
И только усмешку вызывают попытки воспользоваться для прогноза функцией Экселя «Предсказание» или ПРЕДСКАЗ из перечня функций. Что эта функция делает? Она пытается уловить тренд (или тенденцию), притом только линейный, и продолжить эту тенденцию в будущее. Но эпидемия не развивается по прямой ни на одном участке, развитие эпидемии – нелинейный процесс, примеры приведены выше.
Также, не имеет никакого смысла предсказывать развитие эпидемии на начальном этапе - угадать, когда развитие с экспоненты перейдет на логистическую зависимость, трудно, если не невозможно.
Впрочем, горизонтальные участки на графиках развития эпидемии наблюдаются, и называются они плато. Такое плато длительно, на протяжении 4 недель, наблюдалось на графике по России в целом, но оно достаточно простого происхождения – на протяжении всего этого времени в Москве число заболеваний в день снижалось, а в остальных регионах, рассматриваемых как целое, росло, и рост уравнивал спад. Но му уже выше упоминали – Россия велика.
Оранжевая линия - Москва, серая - прочие регионы, красная - Россия в целом. Явственно видно державшееся 3 недели плато на уровне 8.500-9.000 заболевших в день.
На графике Италии никакое плато не просматривается, но обратите внимание - быстрый спад заменяется на медленный, затем вновь происходит ускорение падения. Т.е. плато готово было сформироваться, но не сложилось