Заголовок не кликбейтовый – такая возможность по России, на основании ежедневно обновляемых официальных данных по количеству подтвержденных случаев заражения в России за сутки, появилась начиная с 16 апреля 2020 года. Сегодня 18 апреля, данная статья будет обновляться, или, вернее, дописываться ежедневно, по 22 апреля, после чего будет подведен итог недели, и 23 апреля открыта новая статья на вторую неделю прогноза. Надеемся, так до конца сезона коронавируса. Сезон по нашим данным открыт 16 марта, когда число зараженных за сутки исчислялось еще десятками, и завершенным сезон сочтем при спаде до этого же уровня.
Первый вопрос, который возникает – это отчего возможность прогноза появилась только 16 апреля. Ответ прост – оптимистичный прогноз не мог быть дан по имеющимся данным. Оптимистичный не в смысле благоприятного прогноза, а в смысле возможности сам прогноза дать.
Прогноз возможен только на основании правильной математической модели, описывающей процесс заражения. Если модель правильная и отражает механику процесса, то по неполным начальным данным можно сделать прогноз (экстраполировать) всего процесса, вплоть до его завершения.
Поясним. На ценнике указана цена товара – 100 рублей штука. У вас есть модель – стоимость партии товара пропорциональна количеству единиц товара в партии. 3 штуки товара будет стоить 300 рублей, это линейная модель. Но выбранная вами модель может быть неверной – приглядевшись, вы замечаете на ценнике надпись: «Акция. 3 по цене 2». Покупаете 3 штуки товара и платите 200 рублей. Модель приобретения товара оказывается нелинейной.
Правильная модель распространения эпидемии всего одна, она же и самая простая. Предложена она была в 1838 году бельгийским математиком Пьером Франсуа Ферхюльстом для моделирования процесса прироста населения, и оказалась пригодной и для описания процесса распространения эпидемий. Эта модель неоднократно проверялась, и всегда правильно описывала процессы заражения животных – но только в лабораторных условиях, когда в процессе распространения заражения не менялись условия.
А вот приспособить модель Ферхюльста к реальным процессам распространения эпидемии в человеческом обществе оказалось невозможным – условия игры постоянно менялись, люди имеют обыкновение перемещаться, власти имеют обыкновения эти перемещения в ситуациях форс-мажора ограничивать, что постоянно меняет тенденции.
Вдобавок, власть никогда не имеет текущей картины происходящего, изменения в силу наличия инкубационного периода развития заболевания, притом не фиксированного, а лежащего в определенном интервале (для коронавируса COVID-19 от 4 до 24 дней, а не до 14, как считалось ранее) всегда наступают позднее введения призванных ограничить распространение эпидемии мер.
Но до Ферхюльста существовала другая теория народонаселения, предложенная английским ученым и священником Томасом Мальтусом. Согласно Мальтусу, если отвлечься от народонаселения, то интересующая нас величина растет в геометрической прогрессии, или по экспоненте.
Слово экспонента теперь знают все, экспонентой пугают, экспонента стала страшилкой. Пугают вчерашние институтские двоечники, ставшие экспертами на всевозможных шоу. В комментариях к распространению эпидемии, когда число ежедневно заражаемых исчислялось еще десятками и сотнями, а не тысячами, как ныне, на бесчисленных шоу как заклинание повторялось несведущими людьми – только бы не пошло по экспоненте.
И каждый эксперт считал возможным и нужным непременно назвать срок выхода на т.н. плато, когда процесс распространения остановится и пойдет на спад. Про плато позже – плато хуже чем пик, и особо намаливать его тоже не следует. Да и сроки те давно уже прошли, отчего-то в условиях полной неопределенности эксперты состязались в выдаче наиболее благоприятного приближенного по дате результата, никто не хотел прослыть пессимистом.
При этом эпидемия в тех условиях именно по экспоненте и распространялась, и сказать что-либо вменяемое по масштабу ее распространения и по срокам не представлялось возможным – экспонента ничем не сдерживается и уходит в бесконечность. Действительно, если число ежедневно заражаемых удваивалось каждые 4 дня – где здесь предел? Именно так и считал Мальтус, что предела нет.
Но никакой процесс не может идти по экспоненте бесконечно долго – ресурсы подпитки ее роста всегда ограничены. Мальтус вполне обоснованно считал, что рост народонаселения будет ограничен нехваткой продуктов питания, Ферхюльст обосновал процесс математически. Не вдаваясь в математические детали, можно сказать, что по Ферхюльсту процесс идет по т.н. логистической кривой, которая на начальном участке неотличима от экспоненты, затем наступает точка перегиба, когда прирост за единицу времени (интенсивность процесса) максимальны. А затем все идет на спад, процесс спада симметричен процессу роста.
А теперь к вопросу, отчего прогноз стал возможен лишь 3 дня назад. Процесс был в самом начале, шел по начальному участку логистической кривой, неотличимому от экспоненты – прогноз принципиально невозможен. А вот когда эксперты все еще продолжали ахать по поводу ежедневного прироста числа зараженных, прогресс наметился – очередные количества ежедневно зараженных пошли ниже прежней экспоненты, начала проявляться логиста с признаками точки перегиба, и появилась возможность математического прогноза. Чем мы сейчас и займемся, с добавлением и уточнением каждый день после 11 часов мск времени по получении новых данных.
Еще раз – мы даже и не пытаемся состязаться в прогнозе с прогнозом по сложным моделям, применяемым знающими толк в предмете специалистами; в этих моделях множество параметров, и это недостаток этих моделей. Чем больше параметров, тем лучше модель приближает исторические данные (в прошлом, по факту) и тем хуже она может оказаться для прогноза при малейшей неточности в данных или параметрах модели.
А модель Ферхюльста проста как мычание, у нее минимум параметров, и решение обычно устойчиво. С 16 апреля число ежедневно зараженных стабильно пошло ниже экспоненты, построенной по предыдущим данным за месяц, и появилась возможность прогноза интенсивности процесса с 3 вычисляемыми результатами – даты пика числа ежедневно зараженных, максимального числа зараженных в этот день, и общего числа зараженных за весь процесс распространения эпидемии, от начала до конца.
Поскольку эти данные пересчитываются каждый день, все эти 3 величины меняются, но именно по их изменению можно судить об эффекте мер по сдерживанию эпидемии. Поясним примером – 16 апреля прогноз даты пика был 27 апреля, на следующий день уже 29 апреля, а сегодня, 18 апреля – 3 мая. Соответствующие прогнозы по дате завершения процесса 8 июня, 12 июня и 20 июня.
Соответственно разные прогнозы и по числу зараженных, пиковому и общему.
Вывод однозначен – сейчас процесс разлаживается, принятые меры не обеспечивают стабильного течения процесса с завершением к определенному сроку – этот срок отодвигается по мере приближения к нему. Но возможен и обратный ход – срок начнет приближаться, что возможно при эффективности принимаемых мер.
Итак, в таблице ниже на сегодня заполнены 3 строчки из 7, остальные будут заполняться по мере поступления данных, и вы самостоятельно можете судить о ходе процесса.
Обращаем внимание, что под общим числом зараженных понимается число не к моменту пика, а к моменту завершения эпидемии, т.е. число людей, предположительно заполучивших иммунитет. Но пока мы имеем дело только с регионом Москвы, провинция впереди.
И напоследок. Мы упоминали, что зависимость Ферхюльста соблюдается в лабораторных условиях, при чистоте опыта. В этом случае никакого плато, т.е. уплощения пика, не наблюдается, пиковое значение всего одно, после него идет только спад. В реальных условиях пиков может быть несколько, может наблюдаться плато, т.е. горизонтальный участок зависимости. Подобное обычно признак сложения нескольких зависимостей. То, что мы видим сейчас – это, по сути, развитие эпидемии в Москве, Московской области и Петербурге, вклад регионов мал.
При подключении регионов, с отставанием по времени на несколько недель, подключаемые зависимости можно будет вычленить из общей (на то есть свои методы), и мы непременно тогда приведем, как минимум, две отдельные зависимости, с прогнозом по каждой, при этом одна может идти на спад, а другая еще находиться на подъеме.
Следите за каналом, будет интересно, это наша жизнь. И открывайте каждый день этой недели эту статью, в таблицу будет вписан новый прогноз, вплоть до появления статьи по 2-й неделе.
19.04.2020
Сегодняшнее значение зараженных вновь вывело график на экспоненту, которая, как мы говорили, опаснее логисты, поскольку уходит в бесконечность. Чисто формально логиста еще просчитывается, с отодвиганием даты пика, завершения, и увеличения максимума и общего числа.
Разъяснение простое - если на прошлой неделе ответственные люди говорили о ежедневном приросте числа заражений 17-18%, то последнее изменение на 27%. Это удвоение за 3 дня.
Причина подобных резких всплесков всегда отодвинута назад на 3-4 дня и чуть ранее, исходя из инкубационного периода, а поскольку резервуаром инфекции по-прежнему являются столица и столичный регион, то следует проанализировать, что происходило там 15 апреля (среда), и несколько дней ранее.
Есть перспективы возврата к уже наметившейся стабильности? Да, если последняя цифра прироста 6060 человек удержится подряд 2 дня, т.е. будет объявлена в понедельник и вторник; в подобном случае мы вернемся к ситуации 16 апреля, когда наметился перелом тенденции. 7000 и 8000 в последующие два дня только подтвердят складывающуюся с сегодняшнего дня нехорошую тенденцию. Держите кулачки, сегодня Светлая Пасха.
20.04.2020
Кулачки держали хорошо. Сегодня объявлено впервые за последнее время снижение числа зараженных. Это реально возвращает нас к тому времени, когда мы открыли эту статью с целью прогноза данных. Что-то знал Песков, когда после катастрофического роста вчера через пару часов заявил, что все хорошо, прекрасная маркиза, на неделе ожидается плато и дальнейшие решение, по результатам, об ужесточении либо либерализации режима карантина.
Проблема в том, что значения за вчера и сегодня не принадлежат одной совкупности данных. Значения за каждый день случайны, но случайность заключается при нынешних значениях порядка 5000 зараженных в пределах +/-70-100 единиц, но не +/-1000, что наблюдаем. Отсюда облом все прогнозистам дзена (это, скорей всего, 6-классники, упражняющиеся от скуки в условиях дист. обучения, и уже прошедшие по алгебре графики и функции, притом успевающие 6-классники; бестолочь этого так и не усваивает до 11-класса, ЕГЭ, выпускного бала и получения аттестата), по последнему значению 6060 пронозировавшие непременно 7000 (а отчего не 8000?) сегодня. Любопытно, чем они этот облом теперь объяснят своим подписчикам. Не исключено, затрут, функционал дзена позволяет.
А коли эти значения принадлежат разным совокупностям, то есть и причина. Либо одни сутки были 27 часов, а следующие 21 час, либо изменилась методика подсчета, на что понятно нужен указ, внутренний цензор тут массово не сработает.
Мы же как акыны, поем что видим, это самый правильный взгляд на жизнь. Не следует удивляться, что прогноз мотает с каждым новым днем, с новой цифрой. Рано или поздно рамки прогноза будут сужаться, мы уже сейчас вернулись к тому, с чего начинали - пик в апреле. Следует лишь следить за ближайшими днями, удастся ли застабилизировать число на уровне 5000-6000 тыс. Нескольких дней достаточно, чтобы убедиться в окончательном переломе.
А потом самое интересное. В чистых условиях никаких плато не наблюдается, пик 1 день, затем спад. Ну небольшая незначимая болтанка, как мы писали +/- 100 единиц. А те, от кого зависит форимирование кривой, уверенно говорят о плато. Причин плато 2, вот они, притом проявляться будут одновременно:
1. Подключаются регионы, где пока еще конь не валялся. Регионы сдерживались искусственно, можно подумать, что губернаторы рискнули бы по своей инициативе отправлять борты из Москвы в полном составе на карантин и перегораживать дороги. Им попросту велели выиграть время - нарастить ресурсы - роддома преобразовать в инфекционные отделения, военным выстроить инф. больницы, запастись халатами и вентиляторами, обучить персонал - современный медик тифозную вошь и в глаза не видал, как и холерного больного, что он может понимать в инфекциях. Сдал и забыл.
Сумма нескольких сдвинутых по времени колоколообразных кривых (на одну такую кривую можете поглядеть выше на рисунке с портретом Ферхюльста) и даст плато с окончательным спадом от последнего отставшего от всех региона. Предположим, это будет Алтай. Им Принцессу Укока вернули, после того как землю стало трясти, она их бережет. (Мне принцессу видеть довелось, когда мумия была в музее). Ниже научная реконструкция.
2. После пика, поскольку в регионе Москвы (+область+Петербург) еще не вырабатывается колективный иммунитет при числе заразившихся и выздоровевших менее полумиллиона, периодически, дозированно, путем анализа данных, будут вводиться послабления (шашлыки на маевках, экзамены в вузах, защиты ВКР, ЕГЭ, открытие ресторанов и/или зрелищ, и пр. мест контролируемого заражения), с целью подпитывать достигнутый уровень, с которым в силах справиться инфраструктура медицины (нынешние 6.000 либо макс. 10.000-15.000), и после иммунизации округи свертывание деятельности, передача вентиляторов и персонала регионам, где все только еще начинается.
Сейчас обрабатывать статистику по регионам нет смысла, как не было смысла работать с данными по стране еще неделю назад - данные были ни о чем.
Также, нет смысла сейчас анализировать смертность, летальность, число выздоровевших и пр. Все это цифры по 2-3 неделям назад, они же идут с опозданием ввиду инкубационного периода и времени лечения. Время этих данных еще не наступило.
Ну и воодушевились комментаторы. Сплошняком пошли разговоры про плато, пару часов назад еще все помалкивали.
Ждем завтрашних данных.
21.04.2020
Основная интрига в ожидании сегодняшних данных была по причине инверсии данных - после 4785 сразу 6060, а затем вчерашний провал до 4268. По поводу этой инверсии интернет сутки шумел, выдвигая самые разные конспирологические теории. Все определил сегодняшний день - значение 5642 все поставило на свои места, прогноз даже не шелохнулся, сутки разницы не в счет.
Рост очередного значения до 6060 Скворцова объяснила увеличением чила тестирования, это мы и имели в виду вчера, утверждая, что соседние значения 6060 и 4268 принадлежат разным совокупностям. И сегодняшний подъем до скромных 5642 только подтвердил тенденцию.
Что любопытно, никакого восторга в комментариях по поводу последних цифр не чувствуется, экспертов одинаково угнетает цифра и 6000, и 4000, поскольку то и другое очень много. Это уровень экспертов и математические способности дикаря: один, два, много. Про плато они говорят с чужих слов, сами они ни на что не способны.
Если Москва и центр сохранят тенденцию, все так и пойдет по намеченному, что мы отметили еще 16 апреля. Не забыли. что данные за сегодня нужно посмотреть выше в таблице?
22.04.2020
Тенденция перелома окончательно сформировалась, изменить ее может только нечто из ряда вон выходящее, массовое нарушение режима, с последствиями через 4 и более дней. Как видно, сделанный 16 апреля прогноз практически не изменился.
Сегодня 22 апреля, пик завтра, затем спад. Спад по преобладающему региону, Москва + окружение, но комментаторы усиленно говорят о плато, и при признаках плато мы немедлденно начнем обрабатывать вторую составляющую числа зараженных - по провинции, которая пока включена в общую зависимость.
Следите за каналом, надеюсь, вы уже убедились. что выкладываемая здесь информация по будущему достовернее прогнозов комментаторов бесчисленных шоу, где уже мемом стало что 3 вирусологов 4 мнения.
На этом данная статья завершается, завтра открываем статью, которая будет посвящена прогнозам 2-й недели возможности прогноза.
И по всех интересующему вопросу статистики смертей. Ранее 16 апреля был невозможен прогноз по зараженным, дате пика и предположительного завершения (дата из таблицы оптимистична. учитывает в основном центр, будет протянута вперед, когда пойдут данные по провинции).
А сейчас невозможен прогноз по смертям, так зачем констатировать факты, строя графики по данным? Их время еще не подошло. Но учитывая общий интерес, сегодня к концу дня будет размещена статья по возможности прогноза и этих значений, и, что самое главное, учитывающая специфику контингента по РФ. Зачем нам китайцы, семиты, англосаксы, ромеи либо непонятные люди из плавильного котла, вся статистика оттуда к нам не приложима - другие гены.
Упаси Боже, это не расизм - это теперь общепризнанная точка зрения, у всех разный иммунитет, разная биота и разная восприимчивость к инфекциям, отработанная предками на своей земле. Вдобавок, если еще сказывается история вакцинирования, а она не может не сказаться, в ту или иную сторону, все их данные по % смертности можно и нужно выбросить.
Ниже график прогноза по зараженным.
Статья закрыта, выложена следующая статья по 2-й неделе прогноза.