Найти тему
Yaroslav Gusev

Сферический конь в вакууме от Сбербанка

Коронавирус пытается вписаться в математическую модель Сбербанка
Коронавирус пытается вписаться в математическую модель Сбербанка

4 марта 2020 г. произошло знаменательное событие, Тасс анонсировал новость: "Сбербанк создал модель распространения коронавируса в России" также об этом сообщили: Интерфакс; Форбс; RT; Ren TV; Banki.ru; Vesti.ru. На следующий день, 5 марта, Коммерсант опубликовал статью под названием "Коронавирус вписался в математическую модель" и взял интервью у старшего управляющего директора Управления развития компетенций по исследованию данных Сбербанка Максима Еременко, который сказал следующее: "...в качестве основных параметров на самом деле для любого контагиозного заболевания являются такие факторы как пассажиропоток на авиатранспорте, железнодорожном транспорте, наземном транспорте. Также это факторы, связанные с сезонностью, с плотностью населения" (орфография статьи сохранена). Далее, эти параметры его специалисты сопоставили с уже собранной статистикой по коронавирусу за несколько месяцев, а потом ПОДОГНАЛИ таким образом, чтобы количество авиаперелетов и другие факторы по дням коррелировали с числом заболевших. Днем ранее он говорил, что "чем теплее, тем лучше, потому что когда холодно, сильнее подверженность". (непонятно с чего он это взял, ведь феврале в ЮАР воздух прогревается ночью до +22.8°C, а днем до +33.6°C) и, несмотря на такую высокую температуру, 15 марта в ЮАР был объявлен национальный режим бедствия.

Модель назвали GLEAM и собирались передавать ее Минздраву после доработки.

Дружба Сбербанка и Минздрава
Дружба Сбербанка и Минздрава

Прошло больше месяца, а новостей нет. Судя по всему, ребята впали в интеллектуальный ступор. Наверное, плохо коррелирует число заболевших с пассажиропотоком.

Начну с того, что нельзя сопоставлять статистику по количеству заболевших COVID-19 в разных странах (ребята анализировали массив заболевших COVID-19 по всему миру), т.к. если даже принять в расчетах, что точность исследований абсолютна, (хотя это не так, что доказано в моей статье Covid-19 vs Огурец), то группа обследуемого населения везде разная: в Китае тестирование происходит при минимальных подозрениях на COVID-19, в Южной Корее тестируют всех поголовно, в Японии рассматривают лабораторное обследование как инструмент получения наиболее полных данных об инфекции и т.д.

При таком подходе из этой затеи ничего толкового получиться не могло, говоря словами инструктора IBM из Нью-Йорка Джорджа Фьюччела: «garbage in — garbage out»

Мусор на входе-мусор на выходе
Мусор на входе-мусор на выходе

Поэтому, даже не глядя на 3-и сценария распространения в России COVID-19, сделанных "Старшим управляющим директором Управления развития компетенций по исследованию данных Сбербанка" (длинная должность) Максимом Еременко, смело можно утверждать, что они "мусорные".

Лучше сделаем свою математическую модель распространения COVID-19 в России:

  • Если предположить, что скорость размножения вируса SARS-CoV-2 в России пропорциональна его текущей численности;
  • Если предположить, что скорость размножения SARS-CoV-2 пропорциональна количеству доступных для него людей в России;

То течение эпидемии COVID-19 в России можно было бы описать дифференциальным уравнением:

где: r - скорость роста размножения SARS-CoV-2; P-численность популяции SARS-CoV-2; K - поддерживающая ёмкость среды SARS-CoV-2 (люди)
где: r - скорость роста размножения SARS-CoV-2; P-численность популяции SARS-CoV-2; K - поддерживающая ёмкость среды SARS-CoV-2 (люди)
График этой функции показывает переход между двумя устойчивыми состояниями, сокращая емкость среды для SARS-CoV-2 (самоизоляция людей), мы в теории должны перейти к верхнему состоянию - максимуму, которого может достичь популяция SARS-CoV-2.
График этой функции показывает переход между двумя устойчивыми состояниями, сокращая емкость среды для SARS-CoV-2 (самоизоляция людей), мы в теории должны перейти к верхнему состоянию - максимуму, которого может достичь популяция SARS-CoV-2.

Если посмотреть на сегодняшние графики 11.04.2020 г. течения болезни COVID-19 по странам:

11.04.2020 Италия-Франция
11.04.2020 Италия-Франция
11.04.2020 США-Испания
11.04.2020 США-Испания
11.04.2020 Германия-Китай
11.04.2020 Германия-Китай

Что-то похожее на эту логистическую кривую мы видим в Китае, который справился с пандемией.

Только здесь есть одна проблема: математическая модель, построенная на основе этой формулы (модель Ферхюльста-Пирла), работает только в лабораторных условиях, а в реальной жизни нет. Пирл построил свою модель, когда осуществлял в своей лаборатории программу исследований популяции плодовой мухи дрозофилы (Drosophila melanogaster). Но ни одна попытка моделирования динамики роста численности людей различных стран и регионов с помощью этой модели не увенчалась успехом.

Кот Gleam ищет корреляцию
Кот Gleam ищет корреляцию