Когда в дата-центре что-то начинает работать нестабильно, первая реакция почти всегда одинаковая — искать техническую причину. Проверяют оборудование.
Смотрят температуру.
Диагностируют сеть.
Перепроверяют питание. Это логично: инфраструктура — техническая система, значит и проблемы кажутся техническими. Но на практике не каждая проблема в дата-центре связана с оборудованием. Иногда устройства работают исправно, а сложности всё равно возникают. И в таких случаях проблема оказывается не технической, а организационной. Снаружи они могут выглядеть одинаково. Есть инциденты.
Есть нестабильность.
Есть необходимость вмешиваться. Но причины могут быть совершенно разными. Техническая проблема связана с конкретным элементом системы: устройством, сетью, охлаждением или питанием. Организационная проблема возникает тогда, когда сама система управления инфраструктурой работает неэффективно: информация передаётся плохо, процессы не прозрачны, решения принимаются хаотично. И если их не различать, мож