В 2020 году мир столкнулся с пандемией COVID-19. Каждый день оперативный штаб публиковал цифры: сколько новых случаев, сколько выздоровевших, сколько летальных исходов. Эти данные использовались для принятия решений - от локдаунов до открытия границ.
Но возникает закономерный вопрос: насколько официальная статистика отражала реальную картину?
Математическое моделирование даёт возможность посмотреть на эпидемию «сверху», оценить скрытые процессы, которые не фиксируются тестами и больничной отчётностью. В данном исследовании была использована классическая SEIR-модель для анализа первой волны COVID-19 в России и её регионах.
Что такое SEIR-модель и зачем она нужна?
SEIR — одна из базовых моделей математической эпидемиологии. Население в ней делится на четыре группы:
· S (Susceptible) — восприимчивые к инфекции;
· E (Exposed) — заражённые, находящиеся в инкубационном периоде (ещё не заразны);
· I (Infected) — активные больные, способные передавать инфекцию;
· R (Recovered) — выздоровевшие с приобретённым иммунитетом.
Переход между группами описывается системой дифференциальных уравнений с двумя ключевыми параметрами:
· β — коэффициент заразности (сколько человек в день в среднем заражает один больной);
· γ — скорость выздоровления (обратная длительности болезни).
Преимущество модели не в точном совпадении с официальной статистикой, а в выявлении общих закономерностей: когда наступит пик, как повлияют меры защиты, какова доля «невидимых» носителей.
Эксперимент
Параметры эксперимента и начальные условия:
Для моделирования были взяты реальные данные по восьми регионам России: Москва, Московская область, Санкт-Петербург, Краснодарский край, Республика Татарстан, Свердловская, Нижегородская и Новосибирская области.
Источники данных:
· численность населения — Росстат;
· даты первых выявленных случаев и начальное количество заражённых — официальные сводки оперативного штаба.
Параметры модели:
· длительность болезни — 14 дней (γ = 1/14);
· инкубационный период — 5 дней;
· коэффициент заразности β = 0,3 (соответствует показателю 2,2 новых заражённых за весь инкубационный период).
Расчёт проводился в среде Microsoft Excel методом численного интегрирования с шагом в 1 день на горизонте 150 дней.
Результаты: Москва и Санкт-Петербург
Москва
Население: 12 678 079 человек
Начальное число заражённых: 5
Результат моделирования: пик активных больных — 3 180 000 человек на 115-й день (конец июня 2020 года).
Официальные данные на тот же период: около 60–70 тысяч активных случаев.
Санкт-Петербург
Население: 5 601 911 человек
Начальное число заражённых: 3
Пик модели: 1 400 000 человек на 112-й день.
Официальный пик: 8–10 тысяч человек.
Разница между модельными и официальными значениями составляет от 45 до 175 раз в зависимости от региона. Это не ошибка модели — это указание на то, что реальное число заражённых многократно превышало задокументированное.
Влияние профилактических мер: снижение β в 2 раза
Отдельно был рассмотрен сценарий с выполнением базовых противовирусных мер: социальная дистанция, масочный режим, гигиена рук, изоляция больных. В модели это выражается в снижении коэффициента заразности с β = 0,3 до β = 0,15.
Результат для Москвы:
· пик заражённых снижается до 820 000 человек;
· срок достижения пика сдвигается с 115-го на 310-й день.
Это означает, что даже двукратное снижение эффективной заразности:
· уменьшает максимальную нагрузку на систему здравоохранения почти в 4 раза;
· растягивает эпидемию во времени, делая её более управляемой.
Почему модель не совпадает с официальной статистикой?
Сравнение модельных результатов с официальными данными даёт устойчивое расхождение в десятки раз. Причины этого расхождения носят не математический, а организационно-статистический характер:
1. Ограниченное тестирование — особенно на ранних этапах пандемии количество ПЦР-тестов было недостаточным для выявления всех случаев.
2. Бессимптомное течение — значительная доля заражённых не испытывала симптомов и не сдавала тесты.
3. Самолечение — часть населения сознательно не обращалась в медицинские учреждения.
4. Запаздывание данных — регистрация и публикация статистики всегда отстают от реальных событий.
Заключение
Полученные результаты:
· реальное число заражённых COVID-19 в России в период первой волны в десятки раз превышало официальные данные;
· регионы с большей численностью населения демонстрируют более высокие абсолютные показатели пика заболеваемости;
· снижение коэффициента заразности всего в 2 раза уменьшает пик почти в 4 раза и растягивает эпидемию, снижая нагрузку на здравоохранение.
Ограничения модели:
· модель не совпадает количественно с официальной статистикой (что и не является её задачей);
· результаты являются приблизительными и зависят от выбранных параметров;
· учитываются не все факторы, влияющие на распространение инфекции (сезонность, возрастная структура населения, различия в социальном поведении).
Практическая ценность:
Математические модели типа SEIR — это не инструмент точного прогноза, а способ понять внутреннюю логику эпидемического процесса, оценить эффективность мер и увидеть то, что остаётся за рамками официальной отчётности.
Источники:
1. Братусь А.С., Новожилов А.С., Платонов А.П. Математические модели в эпидемиологии. — М.: Издательство физико-математической литературы, 2021.
2. Перцев Н.В., Кузьминов А.Р. Моделирование эпидемий на основе гибридных автоматов // Математическое моделирование. — 2021. — Т. 33, № 6. — С. 89–104.
3. Данные Росстата о численности населения регионов РФ.
4. Данные оперативного штаба по борьбе с коронавирусной инфекцией (2020–2021 гг.).
5. Официальный сайт ФГБУ «Научно-исследовательский институт гриппа им. А.А. Смородинцева» — раздел моделирования COVID-19.
Дисклеймер: Данные, представленные в статье, получены в рамках учебного исследовательского проекта с использованием упрощённой математической модели (SEIR). Они не являются официальными, не могут заменять данные Роспотребнадзора, Минздрава или оперативного штаба и не предназначены для реального прогнозирования