Основная сложность с техобслуживанием в том, что в целом все понимают — его проводить нужно, но как именно — в большинстве случаев представляется нечетко. Ответ на эти вопросы есть в регламенте. В этой статье постараемся разобраться, какие процедуры должны входить в ТО ИБП, какова их цель и как провести их правильно и эффективно.
Регламент ТО: почему это важно
Зачем нужен регламент ТО?
Во-первых — очевидно, обслуживание сложного технологичного оборудования не должно превращаться в самодеятельность. Изначально регламент определяет производитель оборудования, который его разработал. Это логично: именно он знает, что нужно делать, чтобы оборудование работало долго и четко. Следуя регламенту, вы обеспечиваете правильное функционирование и безопасность оборудования.
Есть и во-вторых, не менее важное с точки зрения владельца. Производитель должны гарантировать два важных факта:
- что оборудование будет работать и выполнять заявленный функционал с требуемым результатом,
- оборудование будет безопасным для людей и экологии.
И то, и другое должно сохраняться в течение всего срока службы, установленного производителем — в среднем 10 лет. Если оборудование перестает соответствовать одному из этих параметров, можно предъявить производителю претензии. При этом производитель их примет только в том случае, если оборудование правильно эксплуатировалось. Прохождение ТО — одно из важных требований.
И все же ТО не должно выполняться “для галочки”. Основываясь на регламентах разных производителей, мы составили усредненный список процедур эффективного ТО ИБП — он будет полезным ориентиром.
Что включает регламент ТО ИБП?
Главная задача ИБП — обеспечивать непрерывность питания нагрузки. Все действия по изобретению, изготовлению, эксплуатации и обслуживанию направлены на то, чтобы питание не прерывалось и было качественным. С точки зрения обслуживания эти действия должны включать следующее.
- Проверка факторов внешней среды
К таким факторам относятся характеристики помещения, воздуха, влажности. Нужно убедиться, что оборудование эксплуатируется в надлежащих условиях.
- Нет ограничений доступа
Нередко в серверном помещении скапливается запасное оборудование, которое ограничивает доступ к ИБП. Если потребуется, например, быстро перевести ИБП на байпас при отключении питания от сети — можно не успеть добраться до источника. Последствия могут быть и более серьезными, если возникнет задымление батарей, которое требует срочных действий. Другая ошибка — когда ИБП смонтировано лицевой панелью к стене или другому оборудованию: если индикация не просматривается, дежурный не увидит сигнала о возникшем сбое.
- Соблюдается температурный режим
Максимально допустимая температура в помещении — 25 градусов. Ее повышение чревато повреждением батарей и как следствие — отказами и ранним выходом из строя.
- Нет опасности попадания воды
Часто над оборудованием смонтированы дренажные трубы, кондиционеры и т.д. В случае протечки есть риск попадания воды внутрь ИБП.
- Соблюдаются требования к качеству воздуха
ИБП для серверных обычно не имеют фильтров. Накопление пыли на контактах внутри плат и других силовых элементов ИБП может привести к короткому замыканию внутри оборудования. Особенно опасна токопроводящая пыль, которая образуется при монтаже металлических изделий. Проверить ее присутствие можно с помощью магнита.
- Внешний осмотр
В первую очередь нужно визуально оценить состояние ИБП: наличие пыли, следы коррозии, механических повреждений. Если они критичны, принять меры для их устранения. Если повреждения коснулись кабельных линий токопроводящих элементов, если есть видимое нарушение изоляции — проблему нужно решить как можно быстрее, иначе может произойти замыкание.
Далее открывают крышки, панели, силовые модули, чтобы оценить состояние внутренних компонентов. Визуальный осмотр позволяет обнаружить вздутые поверхности конденсаторов, нарушение изоляции, перекручивание проводов, следы закопчения и т.д.
Часто заказчики просят ограничиться внешним осмотром из-за опасений повредить оборудование. Однако внутренний осмотр важен: к примеру, из вздутого конденсатора может произойти выброс электролитов, которые повредят другие компоненты ИБП. Чтобы избежать рисков, работы должен вести опытный инженер.
- Контрольные измерения
Далее измеряют физические параметры сети — входящие на ИБП и исходящие из ИБП на нагрузку. Полученные показатели сравнивают с индикацией или параметрами, которые скачаны из контроллеров. Важно убедиться, что сам источник правильно измеряет эти параметры. И если выявлены отклонения, провести калибровку, чтобы избежать ложных или неправильных срабатываний ИБП.
- Тестирование ИБП
Этот этап включает ряд разделов, основной из которых — тестирование батарей. Здесь есть определенные сложности.
Некоторые сервисные компании тестируют батареи методом измерения с помощью приборов (кулонов): разбирают батарейный массив, измеряют внутреннее сопротивление каждой батареи и устанавливают исправность/неисправность. На самом деле это косвенный метод, который может дать недостоверную информацию.
Другой вариант — разрядить каждую батарею и измерить ее характеристики в момент разряда.
Но наиболее эффективно провести контрольный разряд всего массива на текущую или тестовую нагрузку и измерить параметры каждой батареи во время разряда. Только так можно понять, как ведет себя каждая батарея и какое реальное время автономии может обеспечить ИБП.
Во время таких разрядов также производят температурный анализ: с помощью пирометров и тепловизионных камер измеряют температуру батарей, отдельных блоков, проверяют нагрев контактов в батарейных массивах. Это позволяет оценить, насколько батарейный массив исправен или изношен.
- Обеспыливание и протяжка контактов
Если при монтаже контакты протянуты правильно, они служат долго и подтяжки не требуют. Однако по нашему опыту, протяжка нужна достаточно часто.
Самый эффективный способ это проверить — провести тестирование на нагрузки через этот контакт и измерить его температуру. Проверка затяжки с помощью динамометрических ключей не очень эффективна — бывают ситуации, когда из-за недостаточно нарезанной резьбы гайка или винт упирается в конец резьбы и не зажимает контактирующие части. Кроме того, механическая проверка не везде возможна физически. Тепловизионный контроль позволяет точно определить недостаточный контакт.
Обеспыливание моноблочного ИБП проводят с помощью воздуходува. Собирать пыль с элементов оборудования пылесосом неэффективно — воздуходув лучше сбивает осевшую пыль.
Таким способом можно обеспылить только те элементы, на которых отсутствует напряжение. Поэтому на время процедуры нужно перевести нагрузку на механический байпас.
- Чтение и анализ журнала событий ИБП
В контроллере встроен стек памяти, где записываются события, связанные с включением, выключением, переходом на батареи и электронные байпасы, сбоями и т.д. Изучение журнала важно: мелкие отклонения могут быть симптомом потенциальных проблем.
Пример из практики. Наш инженер при проверке несколько раз видел в журнале событий отметку о повышении температуры инвертора, при этом ИБП работал адекватно. По его просьбе служба эксплуатации убедилась, что в этот день не было отключений кондиционирования, проверка вентиляторов тоже не выявила проблем. Зато во время батарейного теста, при нагрузке батареи саму на себя, заметили, что через дроссель инвертора на одной фазе течет повышенный ток по сравнению с двумя другими. Его разобрали и обнаружили нарушение изоляции: было замкнуто несколько витков, что вызывало перегрузку инвертора при повышении нагрузки.
Если бы все это не увидели и не заменили дроссель, впоследствии на нем могло произойти замыкание. Кстати, как оказалось, накануне возле ИБП проводились работы с системой вентиляции — по всей видимости, монтажник уронил инструмент на дроссель.
- Проверка системы сигнализации и мониторинга
Эту процедуру часто пропускают, однако сбои не позволят службе эксплуатации вовремя отреагировать на проблему. Проверка не представляет сложностей: во время работ по ТО или после них нужно узнать у оператора, отображались ли переключения и другие действия.
- Тестирование основных функций ИБП
Основная функция ИБП — переход на батареи. Ее обязательно нужно тестировать в реальном времени, хотя бы кратковременным отключением питания. Только так можно убедиться, что ИБП перешел на батареи и вернулся при появлении питания.
Также проводится тестирование электронного и механического байпаса. В нештатной ситуации ИБП попытается перейти на электронный байпас, если он не работает — мы получим отключение нагрузки.
- Проверка ПО и обновление
Зачем выходят обновления? В них производитель исправляет недостатки, выявленные в процессе эксплуатации конкретной модели ИБП.
Многие заказчики отказываются от этой процедуры. Кто-то опасается, что после изменений появятся новые ошибки, проще работать с уже известной системой. Кто-то считает риском не само обновление, а перевод на механический байпас, который необходим для проведения процедуры. Однако отказываться от обновлений не стоит — они повышают технический уровень оборудования.
- Регламентная замена компонентов
В ИБП есть компоненты, срок службы которых меньше, чем у всего устройства. Обычно производитель предусматривает их замену в течение срока эксплуатации — это необходимо для стабильной работы ИБП. Об этой задаче мы подробно говорили в недавней статье.
Способы минимизировать риски при проведении работ
Обслуживание ИБП имеет некоторые особенности. Главная из них в том, что его выполняют без снятия питания на нагрузке. Специалисты соблюдают все требования безопасности, чтобы не допустить прерывания питания, однако такой риск есть. Исходя из этого, часто заказчики ограничивают проведение работ. Еще одной причиной запретов могут быть опасения из-за самих работ: внутреннего осмотра, разборки модуля, разряда батарей, тестирования байпаса, обновления ПО и т.д.
При этом заказчики не задумываются о том, что отказом сами вносят риск. Во время ТО ситуация под контролем, есть возможность среагировать максимально быстро. Тогда как непроверенный узел может дать сбой внезапно и непредсказуемо.
Есть одна оговорка: ситуация, когда отказ может быть оправдан. Если речь идет о коммерческом использовании ЦОДа, предоставлении машинного зала в аренду и т.п., то часто его риски застрахованы. При этом внезапное отключение питания, связанное со сбоем оборудования, покрывается страховкой. А вот сбой, вызванный целенаправленными действиями, не будет считаться страховым случаем.
Но если заказчик сам эксплуатирует свое оборудование, такие риски обычно не страхуют. Поэтому нет никакого смысла ограничивать проведение работ, напротив, провести их и убедиться в надежности оборудования — в интересах владельца.
При этом, конечно, необходимо принять все меры, чтобы не допустить проблем при испытаниях.
Как работаем мы?
Перед обслуживанием обсуждаем с заказчиком программу, объясняем все действия и риски. Составляем точный список работ. Если есть риски — обсуждаем, как подготовиться, чтобы их минимизировать. Возможные меры:
- пригласить специалиста, который поможет быстро восстановить питание, если оно отключится;
- перенести работы на нерабочее время, вечер или выходные, когда нагрузка меньше или отключение не повлияет на рабочий процесс;
- если возможно, перенести работы на день, когда запланировано регламентное ТО всего ЦОДа. Это позволит отключить нагрузку и свободно провести полный комплекс работ во время ТО остального оборудования. В этом случае можно подключить тестовую нагрузку вместо оборудования;
- перевести питание основного оборудования на другой источник.
Выбранные меры зависят от назначения ЦОДа. Главное — чтобы владелец понимал и учитывал не только то, какие риски несет ТО, но и каких рисков можно избежать с его помощью.