Дата-центры применяются для хранения, обработки и распространения информации в сети. Поэтому трудно представить масштабы проблем, которые возникают при нарушениях в их работе. Но как защитить дата-центры от возможных перебоев с помощью современных технологий? Наши эксперты помогут разобраться в этом вопросе.
Даже самый мощный ЦОД уровня Tier III подвержен риску: от банального несоблюдения техники безопасности до перегрузки серверов. Что объединяет Mail.ru, Qiwi и «Вконтакте»? Эти компании пострадали из-за неисправностей ЦОДа, за которыми последовали многочисленные сбои в их работе. Крупнейший хостинг-провайдер в Европе OVH также понес убытки из-за полного уничтожения центра обмена данными SBG2 и частичного ЦОД SBG1. В результате стали недоступны тысячи ресурсов, таких как сайты Правительства Франции, криптовалютные биржи, и другие.
Часто неполадки ЦОДа не несут глобальных последствий для клиентов, но иногда даже небольшая поломка становиться критичной. Поэтому требуется опережать и устранять подобные ситуации. В этом дата-центрам поможет мониторинг инженерной инфраструктуры.
Как ЦОДы следят за бесперебойностью
Два основных подхода к мониторингу инженерной инфраструктуры ЦОДа:
— Полуавтоматический
При таком комбинированном подходе, в дата-центре расположен collocation — операционный зал с приборами. Кроме этого, там постоянно работают дежурные смены. Помимо использования ручного труда, недостаток этого подхода — отсутствие временной аналитики для улучшения работы ЦОДа.
— Автоматический, или удалённый
Здесь данные передаются не в операторский центр, а сразу в облако, которое автоматически собирает сведения и отображает их оператору. У этого подхода несколько весомых преимуществ:
Во-первых, операционный центр становится полностью виртуальным. Таким образом, бизнес экономит на содержании штата сотрудников и соблюдает все ковидные ограничения.
Во-вторых, данные сохраняются в облаке, где возможно отследить изменения любого параметра всего за пару кликов.
В-третьих, появляется возможность формирования прогнозов об износоустойчивости оборудования. Так, система поможет удешевить и ускорить процесс технического обслуживания ЦОДа.
В-четвертых, формируется полная и прозрачная картина о работе дата-центра. Для владельцев бизнеса получение полной информации о состоянии инженерного оборудования — вопрос нажатия пары клавиш.
Как система мониторинга помогает реагировать на инциденты
С помощью удалённых систем мониторинга любой инцидент выявится точно и своевременно. Для этого нужно четко указать граничные показания, при которых система определяет неполадку. А затем настроить соответствующие сигналы оповещения.
Какие показания стоит отслеживать
В дата-центре мониторят три группы параметров.
Первая — это параметры окружающей среды: температура, относительная влажность и состав воздуха.
Вторая группа относится к источникам бесперебойного питания: напряжение каждой ячейки батареи, общее напряжение батареи, потребляемый ток, потребляемая мощность, состояние ИБП для ЦОДа.
Третья группа параметров связана с работой серверами: загруженность, процессоры, память, трафик.
Система мониторинга тоже ошибается
Система мониторинга — не идеальна. Как и любой продукт, разработанный человеком, она содержит баги. Кроме этого, не исключается вероятность взлома, чтобы похитить данные или нарушить работу инфраструктуры. Если первый фактор не избежать, то столкновение с хакерами возможно предотвратить. Для этого важно не забывать о кибербезопасности, и предпринимать технические меры защиты. Стоит помнить, что самый большой риск — это подмена данных и, следовательно, отсутствие нужной реакции на инциденты.
***
Итак, система мониторинга — оптимальный инструмент управления оборудованием и вычислительными мощностями ЦОДа без капитальных затрат, а также репутационных и финансовых рисков в результате инцидентов.
Хотите узнать больше про технологии ИБП, читайте наш блог на сайте