«Серый кардинал» кластера: что делает служба HA Controller, когда падает Control Plane или ЦОД ловит Split-Brain
В предыдущей статье мы подробно разобрали, как кворум из трех инстансов управляющего центра (Control Plane) страхует платформу от локальных сбоев. Но давайте поднимем градус катастрофы до максимума. Что произойдет, если в дата-центре случится тотальный блэкаут, и все виртуальные машины управления одновременно выйдут из строя? Или еще хуже — если произойдет авария на сетевом уровне, хосты полностью потеряют связь друг с другом, но продолжат жить автономно, имея доступ к общей системе хранения данных? В ИТ-инженерии это называется состоянием «раскола мозга» (Split-Brain)...