Найти в Дзене
Минус фунт

150. 3-я неделя прогноза коронавируса

Оглавление

Предыдущие 2 статьи, первая в цикле «1-я неделя возможности прогноза коронавируса» по ссылке, без нее будет трудно понять, о чем пишем здесь, и вторая «2-я неделя прогноза коронавируса», с историей развития прогноза и смены модели по мере поступления новых данных.

30.04.2020

По прежней модели табличка.

-2

Сегодняшний прогноз откатился на уровень позавчерашнего, сказался сегодняшний антирекорд числа зараженных за день, впервые число превысило 7.000. Повсеместная радость по случаю того, что уменьшается процентная доля прироста общего числа заражений неуместна, интегральная характеристика всегда скрывает общую картину, отслеживать следует дифференциал, т.е. ежедневный прирост. Ждем следующих данных.

Всех с завтрашним праздником. Поздравительная открытка не пример для подражания, это ностальгия по прошлому.

-3

01.05.2020

Объявлено очередное антирекордное значение числа зараженных за день. В табличку внесен уточненный прогноз, модель пока сменить не представляется возможность, Если кто заметил, то компонент регион - всего лишь смещенный компонент центр, подсчитывается смещение. которое порядка 2 недель. Более точно пришлось бы учитывать темп (регион нарастает быстрее центра) и пик (тоже выше), но пока обсчет без гарантии.

Но появился интересный инвариант - при всех вариантах комбинаций центр/провинция общее число зараженных за все время эпидемии составит 190-230 тысяч человек. А смертность, увы, не 1%, а выше, причем последние люди умрут по завершению прироста числа зараженных через пару-тройку недель. Хотя при нынешних принципах выкладывания данных, от которых уже не откажутся (не менять же данные задним числом), объявлено будет окончательно не выше 2.500.

Статистика смертей очень странная, статистике заражений не соответствует, нормальная давно была бы обсчитана с выводами.

02.05.2020

В табличке появился новый столбец - дата предполагаемого пика, который впереди. По данным на сегодня это 5 мая. Не оттого, что сегодня рекордное значение зараженных за день, а к 5 мая проходят 8 дней после Пасхи, а сегодня после Пасхи минула неделя. Инкубационный период коронавируса от 4 до 14 дней (по другим данным, до 21 дня). 8 дней - примерно средний период, но модель не знает, что такое инкубационный период, она даже не знает, что она считает.

Мы разделили общий прирост на условный центр и условную провинцию, никогда даже не заглядывая в данные по центру и провинции, так весь массив данных разделила модель, если заглянуть в старые прогнозы, центр застабилизировался, прошел пик, и находился на спаде, прирост по стране за счет провинции. При продолжении тенденции просматривалась новая уточненная модель.

Посление дни эта тенденция нарушилась, уже 2 дня как доля провинции откатывалась на предыдущие значения, а сегодня прорвала, модель разладилась, параметры каждого компонента резко изменились, и компоненты даже поделились элементами.

Причина - пришлось заглянуть в сегодняшнюю статистику. Весь прирост прироста в почти 1700 человек (мы не оговорились - вчерашний прирост 7933, а сегодняшний 9623, т.е. 1690 человек прирост прироста), исключительно за счет Москвы (вчера -3561, сегодня - 5358), прирост прироста 1797 челоек. Прирост по стране исключительно за счет столицы. И эта же картина по вчерашнему дню. Притом начиная с 26 апреля по 30 апреля прирост по Москве не превышал 3000-3100 человек. Практически цифра за сегодня - уход от наметившейся тенденции на 2.500 челоек.

В ститистике есть прием условного удаления какого-либо "неприятного" или "неудобного" значения с целью поглядеть, как оно бы выглядело. если бы не. Сделаем подобное и мы. Если в модель внести за сегодня значение не фактическое, а меньшее на 2.500, мы возвращаемся к устойчивому прогнозу последних 3-4 дней.

Но эта музыка не играет, что сделано то сделано. Итак, впредь в колонке ведем столбец прогноза пика по стране, до перелома тенденции, спада значений. Что произойдет 5 мая, если на последствия Пасхи не наслоятся последствия выходных дней 1-9 мая.

Замечено это будет именно после 5 -6 мая, а до того времени отмечаем, что видим, и что можно прогнозировать исходя из увиденного.

03.05.2020

Вновь антирекорд, прогноз как таковой просто сводится к отодвиганию даты будущего пика исходя из тенденции ежедневного роста. То, что это разовый вброс, а не продолжение долговременной тенденции, следует из ясно выраженного плато на уровне числа заражений 6000-6100 23-27 апреля. Когда последствия вброса завершатся, зависит от числа дней вброса, а это может быть от 1 дня до 14 - с началом 26 апреля а завершением до 9 мая. А затем на улаживание вброса еще 7 дней, прежде чем проявится тенденция к спаду.

А пока чисто формально обновлена табличка, см. выше. Пик 13 мая. При продолжении последствий вброса эта дата будет уходить вперед; как только пойдет назад, появится надежда, а когда сравняется с текущей датой, будут совсем хорошо. Там можно будет говорить о возврате к прежней тенденции. только на более высоком уровне.

04.04.2020

Процесс на фоне нынешних данных продолжает разлаживаться, интрига в том, добавят ли майские выходные разладку к пасхальным, завтра-послезавтра должно проявиться. Минздрав и Роспотребнадзор в лице своих руководителей отнесли пик на 2 недели вперед, всерьез говорится о продлении ограничений до зимы.

У нас же свои критерии разладки, табличка выше. Позавчера пик был вынесен вперед на 3 дня от текущего, вчера на 10, а сегодня уже на 13. Т.е. разладка ускоряется. И как писали вчера, свет в окошке появится, когда пик начнет приближаться, затем сопадет с текущим днем, а затем окажется позади. И где гарантия, что это случится теперь хотя бы в мае?

05.04.2020

Повторился вчерашний прогноз, это признак стабильности, о чем писали вчера, что ждем приближения даты пика к дате прогноза. 9.000 завтра вернет к позавчерашнему, более благоприятному прогнозу, 10.000-11.000 оставят все как есть, 12.000 откинут на неделю.

Казалось бы, какое значение могут иметь 1000 единиц при общем числе в сотни тысяч, тем более, что идут попытки объяснить колебания числа зараженных изменением числа тестов. Значения на уровне 10.000 можно считать неточными в пределах +/- сотня-другая, но не 1.000, подобное отклонение уже значимо, имеет причину и повлечет последствия.

Собственно, правильнее было бы говорить, что значение 12.000 не откинет на неделю назад, а явится индикатором того, что мы откинуты на неделю назад.

А то, что число зараженных не следует объяснять числом тестов, следует из принципов тестирования. Число тестов - не размер некоторой репрезентативной выбборки, где процент какого-либо признака сохраняется при любом размере выборки. Поскольку тест проводится лишь при симптомах (так утверждалось с самого начала кампании), то количество тестов отражает зараженность, и оттого учитываться не должно, как дублирующее искомое значение (или высоко с ним коррелирующее).

Ждем завтрашнее значение.

06.05.2020

Табличка выше обновлена, заполнена полностью, завтра новая статья на предстоящую неделю. Прогноз 3-й день стабилен, дата пика не выносится ни вперед, ни назад. Пасхальный вброс поддерживается прошедшими с 1 мая 5 днями; если бы 1-майские маёвки и гуляния были крайними, можно было бы ожидать последующего спада. 9.000 завтра - это фантастика и хороший признак. 10.000-11.000 - продолжение сложившегося застоя. 12.000 - катастрофа, последствия нового вброса случаев.

Рисовать график на будущее нет смысла, ближайшие дни определят тенденцию. Но чтобы поддержать традицию представлять график в конце недели, график ностальгический - сегодняшний прогноз, обрезанный справа (причина выше), на котором ясно видна ситуация накануне Пасхи. Мы тогда давали прогноз прохождения пика и выхода на кратковременное плато с последующим спадом.

На графике видно формирование этого плато и резкий рост после 26 апреля с выходом на сегодняшние цифры.

-4

Нулевой день на графике - 16 марта.