Сентябрь 2025. Австралийский оператор Optus проводит плановое обновление брандмауэра. Казалось бы, рутинная задача. Но в результате в течении 14 часов умерло 2 человека. Люди просто не смогли дозвониться в скорую. Что превратило обычное обновление в катастрофу? Ошибку можно было заметить на этапе тестирования, если бы не нарушались процессы работы над проектом и было бы выстроено сильное управление командой. 📊 МЕХАНИКА ПРОВАЛА: • Использовались устаревшие инструкции от 2022 года (никто не проверил актуальность) • Отказ от предварительных проверок ради скорости - слишком спешили выпустить обновление • Игнорирование первых тревожных сигналов - были использованы общие данные, на которых не получилось понять, почему не все звонки проходят. Решили просто забить. • Никто не обратился к более опытным коллегам - инженеры посчитали, что обновление не повлияет на трафик звонков просто основываясь на своем опыте, хотя все процедуры проверок выявили проблему Это не "человеческий фактор". Это сист