О продолжении ⏩
В прошлой заметке я принялся сравнивать безопасность на дорогах Турции и РФ, приводя конкретные цифры по травматизму и смертности на дорогах двух стран. Напомню, что вопросы относительно степени влияния урбанизации и климата на риски ДТП (травматизм и смертность) остались за рамками предыдущей заметки.
Статья привлекла интерес и я очень признателен читателям за обратную связь, которая – является источником идей для дальнейшего анализа. Конечно не вся критика на заметку была конструктивной. В частности, некоторые читатели формулировали обратную связь в следующем ключе:
Неправильно ты, дядя Фёдор, бутерброд ешь… данные приготовил неправильно, считать нужно было по другому, графики непонятные. Я бы сам показал как нужно, да у меня данных нет.
Специально для таких читателей акцентирую еще раз: все данные, которые используются мной – являются публичными. Я не хакер и не взламываю защищенные серверы ГОСАВТОИНСПЕКЦИИ. Более того, я делаю все возможно для того чтобы у любого желающего была возможность перепроверить все расчеты или поиграть с данными самостоятельно. Именно поэтому исходный код обработки данных и построения диаграмм с комментариями можно найти в самом низу, если вы читаете заметку на https://investcookies.ru/. Если вы читаете данную заметку на агрегаторе, то можно пройти по ссылке на первоисточник и найти все там.
Регионы 🏘️
Предметом претензий в мой адрес одного читателя стало то, что я сравнивал показатели безопасности регионов РФ с Турцией в целом. Напомню, что дороги Санкт-Петербурга и Москвы были существенно безопаснее чем дороги Турции в целом. По этому поводу у меня есть две новости: хорошая и плохая. Хорошая новость заключается в том, что мне удалось найти статистику по ДТП в разрезе регионов не только для РФ, но и для Турции. Плохая – Турецкая статистика в разрезе регионов, предоставлена только за последние два года и анализ какой либо динамики будет затруднительным. Напомню, что динамика в РФ имела положительную тенденцию тогда как для Турции такой тенденции не было обнаружено.
Тем не менее, сравнение регионов Турции, например, с городами федерального значения РФ – также не является вполне честным так как города не включают протяженные трассы, расположенные в областях, которые в свою очередь являются источником повышенной угрозы. Чтобы сравнение было честным пришлось объединить Ленинградскую область с Санкт-Петербургом, а Москву с Московской областью и рассчитать статистические показатели для таких квази-регионов.
Получившийся рейтинг наглядно говорит, что травматизм на дорогах всех регионов Турции существенно превышает травматизм в регионах РФ. Смертность на дорогах Краснодарского края самая высокая, второе место по этому антипоказателю занимает излюбленное место российских релокантов – Анталия. Наиболее безопасным городом по риску смертности – является Стамбул и далее следует Москва, которую можно назвать лидером по совокупности рисков ДТП (травматизм и смертность).
Урбанизация 🏡
Следующий вопрос, вызвавший горячие обсуждение можно сформулировать так:
Почему крупные города и агломерации с высоким уровнем урбанизации и плотностью населения (Москва, Санкт-Петербург, Стамбул) имеют значительно лучшие показатели рисков ДТП?
Дело конечно не в плотности населения или уровне урбанизации, а скорее в уже упомянутой протяженности скоростных дорог и средствах обеспечения безопасности на этих дорогах. К сожалению, статистики по количеству дорог и тем более интенсивности движения в городской, сельской местности у меня нет, но вот процент урбанизации можно вычислить. Очевидно, что степень урбанизация будет связана с протяженностью дорог в городской черте, хотя конечно нельзя такую связь назвать на 100% точной. В любом случае, приходиться работать с тем, что есть.
Далее я буду использовать методический прием, который применялся мной в реальных боевых проектах. Не знаю почему, но у многих рвет шаблоны, когда я вместо привычных временных рядов перехожу на совокупность наблюдений, привязанных к объектам реального мира. В данном случае в моем распоряжении имеется статистика по регионам РФ, каждый из которых характеризуется своей смертностью и травматизмом и также своим уровнем урбанизации. Почему бы внутри этой совокупности не поискать взаимосвязь?
На диаграммах рассеяния визуально можно заметить направленность “облака” значений в ту или иную сторону, что означает наличие взаимосвязи или по научному – корреляции. Также были прикреплены гистограммы распределений смертности (верхняя диаграмма справа), травматизма (нижняя диаграмма справа) и урбанизации (верхняя и диаграмма сверху). Это сделано для того чтобы визуально оценить нормальность распределения величин в которых ищется взаимосвязь. В данном случае есть все основания полагать, что нормальное распределение отсутствует и поэтому для количественной оценки взаимосвязи показателей нужно использовать соответствующие методы. Далее я буду использовать достаточно простой и эффективный способ представления взаимосвязи – матрицу корреляций:
Для тех, кто не знаком с таким представлением информации можно дать достаточно простые интерпретации. По диагонали матрицы стоят единички, что означает абсолютную взаимосвязь показателя с самим собой. Из этого факта следует, что наибольшей взаимосвязью обладают два показателя со значением корреляции равным единице. Если корреляция равна минус одному, то такие показатели абсолютно противоположны друг другу. Если корреляция равна нулю, то связи между показателями нет. Естественно, в реальности 1 или -1 не встречаются то есть если, например, замерять показание скорости на спидометре автомобиля, а потом посчитать пройденный километраж каждого отрезка и сравнить с показателями одометра того же автомобиля, то будет небольшое расхождение в силу ошибок замеров и погрешности датчиков автомобиля. В этом случае корреляция будет 0.95 - 0.98, но никак не единица. Значения, расположенные не по диагонали матрицы показывают корреляцию между разными показателями. В данном случае наиболее интересной – является некоторая зависимость между показателем смертности и степенью урбанизации, которая равна -0.34 то есть чем выше степень урбанизации – тем ниже смертность. Важно помнить, что в этом утверждении не указанна причинность: речь идет лишь о взаимосвязи. Старая шутка из среды статистики по этому поводу звучит так:
В городе N-ске была выявленная высокая корреляции между количеством пожаров и количеством пожарных станций из чего был сделан вывод, что увеличение количества пожарных станций приводит к увеличению пожаров в городе 🚒🔥
В конечном счет допускаю, что количество скоростных дорог (показатель, который отсутствует в статистических данных) может одновременно влиять и на урбанизацию и также на смертность на дорогах. Ох уж эта наука – никогда не дает простых ответов на сложные вопросы 🥸 Получается, что сравнение РФ с некоторыми высокоурбанизированными странами западной Европы (Нидерланды – 93%, Бельгия – 98%, Дания – 88% и пр.) будет носить сомнительный характер так как, вероятно, дело будет не в манере вождения или развитости/недоразвитости инфраструктуры, а в силу объективных отличий бескрайних просторов России и уютно-компактной Европы. При этом увеличение урбанизации на 1% будет очень грубо соответствовать сокращению смертности на 1.35 человека на миллион в случае сравнения с Нидерландами можно говорить о дельте в 24.4 погибших на миллион, что достаточно ощутимо, если учесть значение смертности в РФ за 2022 год - 97 погибших на миллион.
Для тех, кто хочет еще сильнее погрузиться в статистические дебри предлагаю перейти на первоисточник и посмотреть разделы со статистическими тестами.
Климат 🌡️
Другой популярной гипотезой о факторах смертности на дорогах, как выяснилось, стал климат, о котором я также упоминал в первой заметке. Следует принять, что климат – есть понятие растяжимое. О чем идет речь? О температуре, о количестве осадков или о конфигурации того и другого?
Я смог найти не так много климатических данных в открытом доступе. Для городов РФ удалось обнаружить данные на сайте ГИДРОМЕТЦЕНТРА РФ, хранящиеся в весьма замысловатом виде и требующие навыков черной магии для работы с ними 🪄 Поэтому если кто-то будет интересоваться как я это сделал – смотрите исходный код и оставляйте комментарии, если что-то не понятно.
Для изучения влияния климата я использовал тот же подход, что и для урбанизации, а именно для статистики регионов РФ искалась взаимосвязь рисков ДТП с показателями средней температуры и количеством осадков.
В получившихся картинках едва можно рассмотреть какую-либо зависимость. Только связь осадков с травматизмом выглядит хоть сколько-нибудь обнадеживающей. Количественная оценка взаимосвязи следует из матрицы корреляции:
Действительно, количество осадков имеет корреляцию величиной 0.37 с показателем травматизма. Если предположить, что среднемесячное количество осадков увеличится на 10 мм, то это приведет к увеличению количества ДТП с пострадавшими на 125 человека на 1 миллион населения региона.
Итоги 🍪
Кратко и сжато о результатах второй части исследования рисков ДТП на дорогах РФ и Турции:
- В сравнении популярных регионов Турции и РФ по безопасности на дорогах лидерами можно назвать столицы: Москву и Стамбул, а вот аутсайдерами будут Анталия и Краснодарский край
- Уровень урбанизации влияет на безопасность на дорогах: 1% роста урбанизации может спасти 1.35 человека на миллион жителей региона
- Климатические условия региона не оказывают влияния на смертность но в некоторой степени влияют на травматизм: рост количества среднемесячных осадков на 10мм ведет к увеличению количества ДТП с пострадавшими на 125 человек на 1 млн. населения
Оставайтесь бдительными на дорогах 🙏