Что такое резервирование в информационной безопасности
Дисклеймер
Материал предназначен для специалистов по информационной безопасности, системных администраторов и разработчиков. Рассматриваются исключительно технологии и методики — принципы работы, архитектура, способы обнаружения и нейтрализации угроз. Статья носит образовательный характер, не содержит инструкций по созданию или распространению вредоносного ПО и не призывает к нарушению законодательства РФ. Ответственность за применение описанных методов лежит на читателе в рамках действующего законодательства.
«Мы говорим о «облаках», хостинге и «девяти девятках» доступности, но фундамент всего этого — обычная электрическая розетка. Отказ одного трансформатора за городом может остановить тысячи виртуальных машин. Резервирование питания, это инженерная дисциплина, превращающая хрупкую зависимость от внешней сети в управляемый и отказоустойчивый ресурс».
Резервирование систем электропитания
Непрерывность работы центра обработки данных, это не абстрактная метрика, а физический процесс, зависящий от подачи электроэнергии. Любой сбой в этом звене обнуляет все вышележащие уровни резервирования: отказоустойчивые кластеры, реплицированные базы данных и распределённые системы. Финансовые потери от простоя измеряются не только упущенной выгодой, но и прямыми затратами на восстановление, компенсации и долгосрочный репутационный ущерб. Поэтому резервирование (redundancy) в ЦОД начинается не с серверов, а с электросети.
Резервирование, это принцип проектирования, при котором функции критического компонента дублируются одним или несколькими независимыми элементами. При отказе основного компонента резервный автоматически или вручную берёт нагрузку на себя, предотвращая простое. В контексте электропитания это означает создание многоуровневой системы, где сбой на одном уровне компенсируется работой следующего.
Методы резервирования электропитания
Эффективная система строится на комбинации методов, каждый из которых решает свою задачу в цепочке поставки энергии — от внешней сети до разъёма на сервере.
Проблемы качества электропитания и их последствия
Полное отключение — лишь самая очевидная проблема. Более коварны и часты кратковременные аномалии, которые не вызывают срабатывания грубых защит, но дестабилизируют работу цифровой электроники.
Избыток питания (Power Excess)
Потеря питания (Power Loss)
Ухудшение качества питания (Power Degradation)
Правила проектирования отказоустойчивых систем электроснабжения
Эти принципы выходят за рамки простого добавления резервных компонентов и касаются архитектурных решений.
- Физическая и электрическая изоляция цепи ЦОД. Питание центра обработки данных должно быть выделенным, начиная от точки подключения к сети энергосбыта. Совместное использование линий с офисными помещениями, лифтами или производственным оборудованием недопустимо из-за риска перекрестного влияния нагрузок.
- Резервирование на уровне вводов. Использование двух и более независимых вводов от разных питающих центров — первый рубеж обороны. Важно, чтобы трассы прокладки кабелей также были географически разнесены для защиты от единой точки отказа (например, раскопки в одном кабельном канале).
- Сквозное кондиционирование питания. ИБП с технологией двойного преобразования, это не просто батарея, а активный фильтр. Он должен устранять все типы аномалий, перечисленных выше, обеспечивая на выходе эталонный сигнал. Дополнительные пассивные фильтры могут потребоваться на вводе для защиты самого ИБП.
- Расслоение резервных систем по времени работы. Система строится по принципу эшелонирования: ИБП покрывает первые секунды-минуты сбоя, за которые должна запуститься и выйти на режим ДГУ. Мощность ДГУ должна рассчитываться с учётом всей нагрузки ЦОД, включая системы охлаждения, которые в момент запуска потребляют больше номинала.
- Инфраструктура для graceful shutdown. При исчерпании ресурсов ИБП и отказе ДГУ система должна иметь возможность корректно и последовательно завершить работу виртуальных машин, сохранить кэши систем хранения и отключить оборудование. Это реализуется через ПО мониторинга ИБП (связь по SNMP/USB) и скрипты автоматизации.
- Регулярное тестирование без снижения доступности. Плановые переводы нагрузки с основного ввода на резервный, запуски ДГУ под нагрузкой, тестирование систем АВР должны быть частью эксплуатационной практики. Только так можно быть уверенным в работоспособности резервных систем в момент реальной аварии.
Итоговая надёжность системы электропитания определяется по принципу «слабейшего звена». Можно установить дублированные генераторы, но если все кабели проложены в одном лотке, который могут залить, резервирование теряет смысл. Грамотное проектирование учитывает не только отказ отдельных устройств, но и общие для них риски (пожары, затопления, человеческий фактор), создавая真正的 отказоустойчивость — способность системы выполнять свою функцию несмотря на частичные повреждения.