В одной из наших недавних статей мы проанализировали данные по смертности в США от коронавируса, и выяснили, что смертность подвержена недельному циклу, с максимумом смертей в четверг и минимумом в понедельник.
Данная статья по смертности от коронавируса в Италии, где эпидемия пошла на явный спад. Ниже график числа ежедневных смертей в зависимости от даты, количество смертей в день - синяя линия.
На данном графике нет характерного для аналогичного графика по США (статья по ссылке выше) пика смертности 16 апреля, тем самым пик по США нельзя объяснить каким-либо космическим явлением, проявившимся по всей Земле.
Попытаемся выявить цикличность (если она есть) пиков и провалов на графике. Первым делом выявляем тренд зависимости, и поскольку недельный цикл таки предполагается, усредняем данные нахождением среднего геометрического с окном в 7 значений. Эти данные нанесены на график выше зеленой линией. Видно, что линия достаточно гладкая.
Вычтем из фактических значений сглаженные значения, график ниже, красная линия.
Что любопытно, данные по Италии позволяют работать непосредственно с величинами отклонения числа умерших от тренда, в отличие от США, где потребовалось преобразование для выравнивания данных по оси времени.
Но мы уже неоднократно убеждались, что обработка данных для их выравнивания расположения пиков и минимумов не меняет, как и выводов о величине цикличности.
Чтобы выявить цикличность по данным, необходимо подвергнуть их автокорреляции. Корреляция, характеризуемая особым коэффициентом корреляции (вычисляемым, например, в Excel), показывает, насколько два ряда данных "похожи" один на другой.
Если сравнивать один и тот же ряд с самим собой, но смещенным на 0, 1, 2 и т.д. дней, то, если ряд характеризуется цикличностью, коэффициент корреляции будет положительным и большИм при смещении на период цикла, и отрицательным при "непохожести", когда значения изменяются в разные стороны.
Ниже такой график по приведенным выше данным при смещении от 0 до 15 дней.
При смещении 0 ряд полностью схож с самим собой, но "похожесть" наблюдается и при смещении на 7 и 14 дней, а максимальная непохожесть при смещении на 2 и 9 дней. Вывод однозначен - смертность от коронавируса в Италии циклична с периодом 7 дней, т.е. зависит от дня недели, в какой-то из дней максимальна, а через 2 дня существенно снижается, после чего вновь растет.
Найдем средние арифметические значения отклонения числа умерших от тренда , всего по 11 полным неделям. Значения ниже.
Окончательные результаты следуют из диаграммы выше. В пятницу и субботу число умерших от коронавируса в Италии превышало ожидаемое в соответствии с общим трендом, это полностью компенсировалось снижением числа умерших в воскресенье, ниже тренда значение было и по понедельникам, после чего во вторник, среду и четверг отклонялось от тренда незначительно.
Одно из возможных объяснений - цикличность заражений по дням недели. Выяснить по этим данным, в какой день недели итальянцы чаще всего заражаются, невозможно, поскольку неизвестно, сколько времени проходит от момента заражения до момента смерти (это величина переменная, инкубационный период + время борьбы организма за выживание).
Также, иной причиной может быть как-то связанная с недельной цикличностью организация работы системы здравоохранения в Италии.
В США пик смертности приходился на четверг, но в следующий день, пятницу, повтора феномена, как в Италии, не было. В то же время, разница во времени между Италией и США (Нью-Йорк) составляет 6 часов, и часть дня, являющегося в Италии пятницей, в США может быть еще четвергом.