Найти тему
Eaton

«24/7 — Полет нормальный!»: как защитить дата-центры от возможных перебоев

Оглавление

Дата-центры применяются для хранения, обработки и распространения информации в сети. Поэтому трудно представить масштабы проблем, которые возникают при нарушениях в их работе. Но как защитить дата-центры от возможных перебоев с помощью современных технологий? Наши эксперты помогут разобраться в этом вопросе.

Даже самый мощный ЦОД уровня Tier III подвержен риску: от банального несоблюдения техники безопасности до перегрузки серверов. Что объединяет Mail.ru, Qiwi и «Вконтакте»? Эти компании пострадали из-за неисправностей ЦОДа, за которыми последовали многочисленные сбои в их работе. Крупнейший хостинг-провайдер в Европе OVH также понес убытки из-за полного уничтожения центра обмена данными SBG2 и частичного ЦОД SBG1. В результате стали недоступны тысячи ресурсов, таких как сайты Правительства Франции, криптовалютные биржи, и другие.

Часто неполадки ЦОДа не несут глобальных последствий для клиентов, но иногда даже небольшая поломка становиться критичной. Поэтому требуется опережать и устранять подобные ситуации. В этом дата-центрам поможет мониторинг инженерной инфраструктуры.

Как ЦОДы следят за бесперебойностью

Два основных подхода к мониторингу инженерной инфраструктуры ЦОДа:

— Полуавтоматический

При таком комбинированном подходе, в дата-центре расположен collocation — операционный зал с приборами. Кроме этого, там постоянно работают дежурные смены. Помимо использования ручного труда, недостаток этого подхода — отсутствие временной аналитики для улучшения работы ЦОДа.

— Автоматический, или удалённый

Здесь данные передаются не в операторский центр, а сразу в облако, которое автоматически собирает сведения и отображает их оператору. У этого подхода несколько весомых преимуществ:

Во-первых, операционный центр становится полностью виртуальным. Таким образом, бизнес экономит на содержании штата сотрудников и соблюдает все ковидные ограничения.

Во-вторых, данные сохраняются в облаке, где возможно отследить изменения любого параметра всего за пару кликов.

В-третьих, появляется возможность формирования прогнозов об износоустойчивости оборудования. Так, система поможет удешевить и ускорить процесс технического обслуживания ЦОДа.

В-четвертых, формируется полная и прозрачная картина о работе дата-центра. Для владельцев бизнеса получение полной информации о состоянии инженерного оборудования — вопрос нажатия пары клавиш.

Как система мониторинга помогает реагировать на инциденты

С помощью удалённых систем мониторинга любой инцидент выявится точно и своевременно. Для этого нужно четко указать граничные показания, при которых система определяет неполадку. А затем настроить соответствующие сигналы оповещения.

Какие показания стоит отслеживать

В дата-центре мониторят три группы параметров.

Первая — это параметры окружающей среды: температура, относительная влажность и состав воздуха.

Вторая группа относится к источникам бесперебойного питания: напряжение каждой ячейки батареи, общее напряжение батареи, потребляемый ток, потребляемая мощность, состояние ИБП для ЦОДа.

Третья группа параметров связана с работой серверами: загруженность, процессоры, память, трафик.

Система мониторинга тоже ошибается

Система мониторинга — не идеальна. Как и любой продукт, разработанный человеком, она содержит баги. Кроме этого, не исключается вероятность взлома, чтобы похитить данные или нарушить работу инфраструктуры. Если первый фактор не избежать, то столкновение с хакерами возможно предотвратить. Для этого важно не забывать о кибербезопасности, и предпринимать технические меры защиты. Стоит помнить, что самый большой риск — это подмена данных и, следовательно, отсутствие нужной реакции на инциденты.

***

Итак, система мониторинга — оптимальный инструмент управления оборудованием и вычислительными мощностями ЦОДа без капитальных затрат, а также репутационных и финансовых рисков в результате инцидентов.

Хотите узнать больше про технологии ИБП, читайте наш блог на сайте