1 подписчик

Реальная эпидемия COVID-19 в России: почему официальная статистика показала не всё?

14 мая14 мая

4 мин

В 2020 году мир столкнулся с пандемией COVID-19. Каждый день оперативный штаб публиковал цифры: сколько новых случаев, сколько выздоровевших, сколько летальных исходов. Эти данные использовались для принятия решений - от локдаунов до открытия границ.

Но возникает закономерный вопрос: насколько официальная статистика отражала реальную картину?

Математическое моделирование даёт возможность

Но возникает закономерный вопрос: насколько официальная статистика отражала реальную картину?

Математическое моделирование даёт возможность

Но возникает закономерный вопрос: насколько официальная статистика отражала реальную картину?

Математическое моделирование даёт возможность посмотреть на эпидемию «сверху», оценить скрытые процессы, которые не фиксируются тестами и больничной отчётностью. В данном исследовании была использована классическая SEIR-модель для анализа первой волны COVID-19 в России и её регионах.

Что такое SEIR-модель и зачем она нужна?

SEIR — одна из базовых моделей математической эпидемиологии. Население в ней делится на четыре группы:

· S (Susceptible) — восприимчивые к инфекции;

· E (Exposed) — заражённые, находящиеся в инкубационном периоде (ещё не заразны);

· I (Infected) — активные больные, способные передавать инфекцию;

· R (Recovered) — выздоровевшие с приобретённым иммунитетом.

Переход между группами описывается системой дифференциальных уравнений с двумя ключевыми параметрами:

· β — коэффициент заразности (сколько человек в день в среднем заражает один больной);

· γ — скорость выздоровления (обратная длительности болезни).

Преимущество модели не в точном совпадении с официальной статистикой, а в выявлении общих закономерностей: когда наступит пик, как повлияют меры защиты, какова доля «невидимых» носителей.

Эксперимент

Параметры эксперимента и начальные условия:

Для моделирования были взяты реальные данные по восьми регионам России: Москва, Московская область, Санкт-Петербург, Краснодарский край, Республика Татарстан, Свердловская, Нижегородская и Новосибирская области.

Источники данных:

· численность населения — Росстат;

· даты первых выявленных случаев и начальное количество заражённых — официальные сводки оперативного штаба.

Параметры модели:

· длительность болезни — 14 дней (γ = 1/14);

· инкубационный период — 5 дней;

· коэффициент заразности β = 0,3 (соответствует показателю 2,2 новых заражённых за весь инкубационный период).

Расчёт проводился в среде Microsoft Excel методом численного интегрирования с шагом в 1 день на горизонте 150 дней.

Результаты: Москва и Санкт-Петербург

Москва

Население: 12 678 079 человек

Начальное число заражённых: 5

Результат моделирования: пик активных больных — 3 180 000 человек на 115-й день (конец июня 2020 года).

Официальные данные на тот же период: около 60–70 тысяч активных случаев.

Санкт-Петербург

Население: 5 601 911 человек

Начальное число заражённых: 3

Пик модели: 1 400 000 человек на 112-й день.

Официальный пик: 8–10 тысяч человек.

Разница между модельными и официальными значениями составляет от 45 до 175 раз в зависимости от региона. Это не ошибка модели — это указание на то, что реальное число заражённых многократно превышало задокументированное.

Влияние профилактических мер: снижение β в 2 раза

Отдельно был рассмотрен сценарий с выполнением базовых противовирусных мер: социальная дистанция, масочный режим, гигиена рук, изоляция больных. В модели это выражается в снижении коэффициента заразности с β = 0,3 до β = 0,15.

Результат для Москвы:

· пик заражённых снижается до 820 000 человек;

· срок достижения пика сдвигается с 115-го на 310-й день.

Это означает, что даже двукратное снижение эффективной заразности:

· уменьшает максимальную нагрузку на систему здравоохранения почти в 4 раза;

· растягивает эпидемию во времени, делая её более управляемой.

Почему модель не совпадает с официальной статистикой?

Сравнение модельных результатов с официальными данными даёт устойчивое расхождение в десятки раз. Причины этого расхождения носят не математический, а организационно-статистический характер:

1. Ограниченное тестирование — особенно на ранних этапах пандемии количество ПЦР-тестов было недостаточным для выявления всех случаев.

2. Бессимптомное течение — значительная доля заражённых не испытывала симптомов и не сдавала тесты.

3. Самолечение — часть населения сознательно не обращалась в медицинские учреждения.

4. Запаздывание данных — регистрация и публикация статистики всегда отстают от реальных событий.

Заключение

Полученные результаты:

· реальное число заражённых COVID-19 в России в период первой волны в десятки раз превышало официальные данные;

· регионы с большей численностью населения демонстрируют более высокие абсолютные показатели пика заболеваемости;

· снижение коэффициента заразности всего в 2 раза уменьшает пик почти в 4 раза и растягивает эпидемию, снижая нагрузку на здравоохранение.

Ограничения модели:

· модель не совпадает количественно с официальной статистикой (что и не является её задачей);

· результаты являются приблизительными и зависят от выбранных параметров;

· учитываются не все факторы, влияющие на распространение инфекции (сезонность, возрастная структура населения, различия в социальном поведении).

Практическая ценность:

Математические модели типа SEIR — это не инструмент точного прогноза, а способ понять внутреннюю логику эпидемического процесса, оценить эффективность мер и увидеть то, что остаётся за рамками официальной отчётности.

Источники:

1. Братусь А.С., Новожилов А.С., Платонов А.П. Математические модели в эпидемиологии. — М.: Издательство физико-математической литературы, 2021.

2. Перцев Н.В., Кузьминов А.Р. Моделирование эпидемий на основе гибридных автоматов // Математическое моделирование. — 2021. — Т. 33, № 6. — С. 89–104.

3. Данные Росстата о численности населения регионов РФ.

4. Данные оперативного штаба по борьбе с коронавирусной инфекцией (2020–2021 гг.).

5. Официальный сайт ФГБУ «Научно-исследовательский институт гриппа им. А.А. Смородинцева» — раздел моделирования COVID-19.

Дисклеймер: Данные, представленные в статье, получены в рамках учебного исследовательского проекта с использованием упрощённой математической модели (SEIR). Они не являются официальными, не могут заменять данные Роспотребнадзора, Минздрава или оперативного штаба и не предназначены для реального прогнозирования