Найти в Дзене
Игорь Ляпин

Ветер дует, огонь горит, дождь льется … а инциденты и аварии происходят.

ИТ отрасль относительно молодая, и она проходит все стадии становления, которые другие уже пробежали в свое время. При этом результаты, методы и идеи из параллельных областей управления могут показаться чрезвычайно любопытными и новыми для ИТ, несмотря на тот факт, что ИТ сообщество состоит из высокообразованных и эрудированных индивидуумов.

И сегодня мы посмотрим две модели, которые можно использовать для идентификации причинно следственных связей и выбора подхода к управлению эксплуатацией ИТ в части уменьшения инцидентов и аварий.

В первую очередь это конечно же модель Хайнриха — пирамида Хайнриха предложенная в 1931 году как эмпирическая модель несчастных случаев. Интересна она тем что на практических замерах, которые слабо зависли от организации и функционально области где была получена взаимосвязь между инцидентами не повлекшими травмы (а модель применялась прежде всего к охране труда и только потом уже использовалась для других аварийных случаев) и выглядит она примерно как 300- 30-1. На 300 случаев незначительных повреждений приходится 30 средних и только один серьезный урон.

Вывод для ИТ, как и для любой другой отрасли можно сделать следующий, невозможно выделено бороться с тем самым единственным аварийным случаем, необходимо работать с подводной частью айсберга — кормовой базой аварийности и корневой причиной проблем.

Рассмотренная выше модель одна из самых простых и интуитивно понятных, тем не менее более сложные модели аварий позволяют сделать аналогичные выводы.

Давайте посмотрим на модель «швейцарского сыра» или модель Ризона которая показывает что в разнообразных средства на различных уровнях, которые обеспечивают безопасность (в данном случае речь о предметной области безопасности полетов)

-2

могут быть заложены некоторые скрытые условия, которые при определенных обстоятельствах могут сложиться в путь аварии.

Хорошие новости в том что любой слой «сыра» с не совпавшими «дырками» следующего слоя может воспрепятствовать аварии или инциденту. Тем самым уменьшая возможности совершения ошибок и возникновению инцидентов на любом из уровней, мы уменьшаем вероятность крупной аварии в итоге. Тот же самый эффект можно получить увеличением управляемых областей — факторов влияния, то есть слоев в модели.

Итого соединяя все вместе, только повышая культуру работы, снижая отклонения от заданных параметров производственных процессов и инцидентов с незначительным воздействием, можно сократить следующий слой и в результате постоянной и системной работы снизить вероятность серьезных последствий аварийных ситуаций.

В следующий раз мы посмотрим как найти эти скрытые слой и ошибки...

Еще больше на канале "Но что конкретно ты имела ввиду"