Найти в Дзене
Герман Геншин

Cloudflare Dashboard и API не работают после отключения питания в центре обработки данных

Обновление от 02 ноября, 22:12 EDT: В обновленном сообщении об инциденте говорится, что компания частично восстановила электропитание основного центра обработки данных в Северной Америке и работает над восстановлением полной функциональности затронутых продуктов.

"Питание основного центра обработки данных Cloudflare в Северной Америке частично восстановлено. Cloudflare передала некоторые основные сервисы в резервный центр обработки данных, что позволило частично устранить последствия", - говорится в сообщении Cloudflare.

"В настоящее время Cloudflare работает над восстановлением оставшихся затронутых сервисов и возвращением основного центра обработки данных в Северной Америке в рабочее состояние".

Обновление от 02 ноября, 20:12 EDT: Представитель Cloudflare сообщил Герман Геншин, что основной причиной продолжающегося сбоя является региональная проблема с электропитанием, вызванная сбоями в работе генераторов, которые вывели объекты из строя.

"Мы работаем в нескольких резервных дата-центрах в штате Орегон, которые обеспечивают питание плоскости управления Cloudflare (приборная панель, логирование и т.д.). В регионе возникла проблема с электроснабжением, которая затронула несколько объектов в регионе. В течение ночи эти объекты не вырабатывали электроэнергию. Затем, сегодня утром, произошли многочисленные сбои в работе генераторов, которые полностью обесточили объекты", - сказал представитель компании.

"Мы перешли на аварийное восстановление, и большинство наших услуг восстановлено. Перебой в работе центра обработки данных повлиял на работу информационных панелей и API Cloudflare, но не повлиял на трафик, проходящий через нашу глобальную сеть. Мы работаем с поставщиками наших центров обработки данных над выяснением причин регионального отключения электроэнергии и сбоев в работе генераторов. Мы планируем опубликовать несколько блогов, основанных на полученных данных, и сможем поделиться ими с вами, когда они будут опубликованы".

В результате продолжающегося сбоя в работе Cloudflare были отключены многие ее продукты, включая информационную панель компании и соответствующие интерфейсы прикладного программирования (API), используемые клиентами для управления конфигурациями сервисов и их чтения.

Полный список сервисов, работа которых полностью или частично нарушена, включает приборную панель Cloudflare, API Cloudflare, Logpush, WARP / Zero Trust device posture, Stream API, Workers API и Alert Notification System.

"Данная проблема оказывает влияние на все сервисы, которые полагаются на нашу инфраструктуру API, включая Alerts, функциональность Dashboard, Zero Trust, WARP, Cloudflared, Waiting Room, Gateway, Stream, Magic WAN, API Shield, Pages, Workers", - говорится в сообщении Cloudflare.

"Клиенты, использующие Dashboard / Cloudflare API, подвержены влиянию, поскольку запросы могут не выполняться и/или могут отображаться ошибки".

В настоящее время клиенты испытывают проблемы при попытке войти в свои учетные записи и видят ошибки аутентификации 'Code: 10000" ошибки аутентификации и внутренние ошибки сервера при попытке получить доступ к панели управления Cloudflare.

По словам представителей Cloudflare, проблемы с сервисом не влияют на доставку кэшированных файлов через Cloudflare CDN или функции безопасности Cloudflare Edge.

-2

Отключение питания в центре обработки данных привело к проблемам с приборной панелью и API

Через два часа после начала сбоя компания сообщила, что проблемы связаны с отключением электропитания в нескольких центрах обработки данных.

"Компания Cloudflare оценивает ситуацию с отключением электроэнергии в центрах обработки данных и одновременным отказом сервисов. Мы будем регулярно предоставлять обновления до тех пор, пока проблема не будет решена. Благодарим вас за терпение, пока мы работаем над устранением проблемы", - говорится в обновленном отчете об инциденте.

Это уже второй крупный сбой в работе Cloudflare с начала недели: первый вывел из строя несколько продуктов, включая Cloudflare Sites and Services (Access, CDN Cache Purge, Dashboard, Images, Pages, Turnstile, Waiting Room, WARP, Workers KV) в понедельник, 30 октября.

Как объяснила компания в опубликованном через два дня аналитическом отчете, перебои в понедельник были вызваны неправильной конфигурацией инструмента, используемого для развертывания новой сборки Workers KV.

Рабочие KV "используются как клиентами, так и командами Cloudflare для управления конфигурационными данными, поиском маршрутизации, статическими пакетами активов, токенами аутентификации и другими данными, требующими доступа с низкой задержкой", - заявили представители Cloudflare Мэтт Силверлок и Крис Эванс.

"Во время этого инцидента KV вернула вместо запрошенной пары ключ-значение код состояния HTTP 401 (Unauthorized), который она считала правильным, из-за ошибки в новом инструменте развертывания, используемом KV".

По новым правилам Дзена свежие материалы показываются в первую очередь подписчикам, которые реагируют на публикации. Поэтому не забывайте подписаться, поставить лайк и оставить комментарий, так вы будете первым узнавать о всех новых статьях на нашем канале!