Когда происходит серьёзная авария, она почти всегда воспринимается как внезапная. «Всё же работало».
«Ничего не предвещало».
«Просто в какой-то момент всё упало». Но в реальности инфраструктура почти никогда не останавливается резко. Перед остановкой она проходит вполне предсказуемый путь —
просто этот путь редко отслеживают как единый процесс. Любая серьёзная авария — это не точка.
Это результат накопления отклонений. Сначала система слегка отклоняется от нормы.
Потом эти отклонения начинают повторяться.
Затем они накладываются друг на друга. И только в конце происходит остановка. Проблема в том, что внимание обычно включается только на последнем этапе. На этом этапе всё формально работает. Но если смотреть внимательно: Это самый ранний сигнал. И самый игнорируемый. Потому что «ничего критичного не происходит». Дальше система начинает «шуметь». Это проявляется в деталях: Каждое событие по отдельности — не проблема.
Но вместе они создают нагрузку на систему. И главное — на внимание ком