Из-за неисправности электрического оборудования в одном из ЦОД Google произошел серьезный инцидент — взрыв оборудования. Тем не менее, в недоступности сервисов винят неудачное обновление ПО.
ЦОДы взрываются
Вы наверняка знаете, какие требования предъявляются к дата-центрам в части защиты оборудования от перебоев электричества, пожаров и разного рода аварий. Тем не менее, ЦОДы периодически горят, а иногда даже взрываются. Даже у таких гигантов, как Google.
8 августа приблизительно в 20 часов по местному времени в дата-центре Google, что в штате Айова, прогремел взрыв. Причиной аварии стала неисправность электрического оборудования. Судя по данным из Twitter-аккаунта Council Bluffs Scanner, публикующего радиопереговоры экстренных служб, в результате инцидента пострадали трое человек — их оперативно госпитализировали с ожогами разной степени.
Пожар с недоступностью сервисов не связан?
По данным сайта Down Detector, вечером того же дня пользователи сервисов Google стали жаловаться на перебои в их работе. Всего было зафиксировано около 30 тысяч репортов, связанных с Google. Больше всего жалоб пришлось на поиск, чуть меньше «досталось» YouTube и Google Maps.
Однако представители Google заявляют, что падения сервисов никак не связаны с аварией в ЦОД. По официальной версии проблемы в работе поиска, YouTube и Google Maps были вызваны некорректным обновлением программного обеспечения.
Причиной отключения электроэнергии в ЦОДах нередко становятся высокие температуры
Проблемы с электропитанием в ЦОД могут быть вызваны множеством причин. И одна из них — аномально высокие температуры.
Так, например, в прошлом месяце из-за рекордной жары с отключениями столкнулись дата-центры Google и Oracle. Обе компании назвали причиной аварии проблемы с системами охлаждения — они попросту не справились с сорокоградусной жарой.
Краткая история пожаров в ЦОД
Инцидент в дата-центре Google наверняка заставил вас вспомнить о громкой аварии прошлого года. Пожар в ЦОДе европейского хостинг-провайдера OVH «уронил» огромное количество сайтов, онлайн-сервисов и бизнес-приложений во всем мире. В результате аварии пострадало огромное количество правительственных ресурсов, интернет-магазинов, СМИ, банков и других организаций.
Точная причина аварии в отчетах не называется. Судя по всему, огонь вспыхнул в двух энергоотсеках, а отсутствие огнетушителей и систем отключения электричества позволило ему быстро распространиться по зданию SBG2, полностью уничтожить его и повлиять на сервисы, расположенные в трех других зданиях кампуса — SBG1, SBG3 и SBG 4.
В ходе расследования появилась информация о том, что в течение часа до пожара сенсоры на силовых инверторах регистрировали крайне высокий уровень влажности. Это могло стать причиной короткого замыкания, которое и вызвало такие масштабные последствия. Была ли это ошибка датчиков или возле оборудования действительно появилась жидкость, так и не установили.
Будьте внимательны при выборе хостинг-провайдера и всегда уделяйте вниманию изучению ЦОД, в котором будут храниться ваши данные. А если перед вами стоит задача управления физической инфраструктурой и оборудованием дата-центра — советуем попробовать наш DCImanager.
DCImanager — платформа для управления мультивендорной ИТ-инфраструктурой для ЦОД любого масштаба. С легкостью управляйте серверами, питанием, сетевым оборудованием, VLAN, IP-адресами, ведите учет «железа» и отслеживайте все важные показатели его работы.
Больше о DCImanager — на странице продукта.