Найти в Дзене

Тихий страж вашего ЦОД: что должно мониториться в машинном зале

Вадим Жирнов, Архитектор инженерных систем Systeme Electric Когда речь заходит о мониторинге в дата-центре, большинство сразу вспоминает о температуре и влажности. Это важно. Но современный ЦОД- это сложная экосистема, где каждая мелочь может стать причиной простоя. И вот тут на сцену выходит инфраструктурный мониторинг. Он работает 24/7, не спит, не отвлекается, и первым узнаёт, если что-то пошло не так. Что мониторит умный ЦОД? И что бывает, если не мониторит? 2. Температура и влажность Базовые параметры, но критически важные. Перегрев- враг серверов. Недостаточная влажность- риск статического электричества. Избыточная- коррозия. Рекомендуемые диапазоны: ASHRAE TC 9.9, TIA-942, ГОСТ Р 54418.1-2012, СП 60.13330.2020. Кейс: температурные датчики были установлены только в верхней части стойки. Внизу- «горячий остров»: температура превысила +40°C. Результат: деградация дисков и сбой в работе кластера. Установка дополнительных датчиков по уровням стойки помогла бы сбалансировать охлаждени

Вадим Жирнов, Архитектор инженерных систем Systeme Electric

SysrtemeBotz- масштабируемая система активного мониторинга
SysrtemeBotz- масштабируемая система активного мониторинга

Когда речь заходит о мониторинге в дата-центре, большинство сразу вспоминает о температуре и влажности. Это важно. Но современный ЦОД- это сложная экосистема, где каждая мелочь может стать причиной простоя.

И вот тут на сцену выходит инфраструктурный мониторинг. Он работает 24/7, не спит, не отвлекается, и первым узнаёт, если что-то пошло не так.

Что мониторит умный ЦОД? И что бывает, если не мониторит?

2. Температура и влажность

Базовые параметры, но критически важные. Перегрев- враг серверов. Недостаточная влажность- риск статического электричества. Избыточная- коррозия.

Рекомендуемые диапазоны: ASHRAE TC 9.9, TIA-942, ГОСТ Р 54418.1-2012, СП 60.13330.2020.

Кейс: температурные датчики были установлены только в верхней части стойки. Внизу- «горячий остров»: температура превысила +40°C.

Результат: деградация дисков и сбой в работе кластера.

Установка дополнительных датчиков по уровням стойки помогла бы сбалансировать охлаждение.

2. Протечки (точечные и ленточные датчики)

  • Точечный датчик- фиксирует попадание влаги в конкретной зоне (например, под кондиционером).
  • Ленточный датчик- укладывается вдоль стоек, кабельных лотков или периметра, реагирует на воду на любом участке.

Нормативы: TIA-942, СП 60.13330.2020 (HVAC), ГОСТ Р 53118-2008.

Кейс: в машинном зале произошла утечка конденсата из внутреннего блока кондиционера. Воды было немного, но она попала под стойку с оборудованием.

Результат: короткое замыкание, 8 часов простоя.

Точечный датчик под кондиционером или ленточный вдоль пола обнаружил бы воду за 2 минуты.

3. Датчик открытия двери

Контроль физического доступа- не менее важен, чем логическая безопасность. Датчик фиксирует факт открытия двери: можно настроить уведомления, тревоги, логи.

Нормативы: ISO/IEC 27001, TIA-942, 152-ФЗ «О персональных данных», требования ФСТЭК.

Кейс: инженер забыл закрыть дверь серверной после ночного обслуживания. Уборщица случайно задела кабель питания.

Результат: отключение части серверов.

Датчик открытия + автоматическое уведомление позволили бы вовремя вмешаться.

4. Датчик наличия напряжения

Контролирует наличие питания на линии, розетке или устройстве. Особенно полезен для мониторинга ИБП, кондиционеров, насосов, охранных и пожарных систем.

Нормативы: ISO/IEC 30134, ГОСТ Р 53118-2008, СП 256.1325800.2016 (электроснабжение ЦОД).

Кейс: один из ИБП вышел из строя, но авария осталась незамеченной. При следующем отключении основного питания- отказ кластера.

Датчик наличия напряжения выявил бы проблему заранее.

5. Дискретный вход (Dry Contact)

Многофункциональный вход для подключения сторонних систем:

  • пожарной сигнализации
  • охранной сигнализации
  • реле аварийного отключения
  • датчиков дыма, газа, вибрации и др.

Нормативы: ГОСТ Р 53325-2012, СП 5.13130.2009, 123-ФЗ «О требованиях пожарной безопасности».

Кейс: в пожарной системе произошёл обрыв шлейфа. Центральная панель не передала тревогу, а персонал не заметил сбой.

Дискретный вход, подключённый к реле контроля, сообщил бы об ошибке мгновенно.

Почему это важно?

Мониторинг- это не просто «глазки» на стойках. Это проактивная защита.

Он не просто фиксирует факт, а предупреждает о рисках до того, как случится авария.

Благодаря таким системам можно:

  • автоматически уведомлять персонал
  • вести журнал событий
  • интегрироваться с BMS и системами управления зданием
  • снижать время реакции и предотвращать простои

Нормативные документы (TIA-942, ISO/IEC 30134, ГОСТ Р 53118-2008, СП 5.13130.2009, ФЗ-123) прямо или косвенно требуют наличия таких систем.

Вывод:

ЦОД- это не только сервера. Это живая система, где всё взаимосвязано.

И чем больше параметров вы контролируете- тем выше надёжность и соответствие нормативам.

Температура- это только верхушка айсберга.

А под ней- целый мир датчиков, которые работают, пока вы спите.