Крупные системы редко рушатся мгновенно. Чаще они дают сбой тихо, почти незаметно — до тех пор, пока последствия не становятся необратимыми. Один из самых показательных примеров произошёл в гражданской авиации и долгое время рассматривался как «незначительный технический инцидент». Современное авиа-движение управляется автоматизированными системами: Человек в этой системе — наблюдатель и подтверждающее звено.
Так было задумано для повышения безопасности. В один из обычных рабочих дней произошло:
— обновление программного модуля
— частичный сбой синхронизации
— задержка отображения данных Система продолжала работать.
Но не совсем корректно. Операторы видели информацию с опозданием в несколько секунд — слишком мало, чтобы сразу заметить проблему, и слишком много для сложной системы. Инструкции не предусматривали немедленного отключения: Решение «продолжить работу» выглядело рациональным. Через несколько часов:
— маршруты начали конфликтовать
— рейсы задерживались
— нагрузка на п