Найти в Дзене

AWS говорит, что восстанавливается после сбоя, который нарушил работу Slack, Duolingo и сотен других приложений

Автор фото,Nikolas Kokovlis/NurPhoto via Getty Images
Автор фото,Nikolas Kokovlis/NurPhoto via Getty Images

В работе Amazon Web Services (AWS) произошел глобальный сбой, из-за чего пострадала работа десятков популярных сайтов и приложений. По данным Down Detector, сбои наблюдались в работе в работе Zoom, Signal, Slack, Canva, Roblox и многих других сервисов. Согласно последнему сообщению компании, работа большинства сервисов восстановлена.

Сбой также затронул многие финансовые учреждения, включая британские банки Barclays, Lloyds и Bank of Scotland: пользователи сообщают, что не могут войти в свои банковские приложения. Кроме того, в социальных сетях появились сообщения, что у некоторых клиентов отклоняются платежи по банковским картам.

В банке Lloyds заявили, что сбои в работе его приложения и приложений дочерних Halifax и Bank of Scotland имеют отношение к сегодняшним проблемам в работе Amazon Web Services.

Amazon Web Services — крупнейший поставщик услуг облачных вычислений. Инфраструктура AWS поддерживает работу миллионов сайтов и платформ крупных компаний, от центров обработки данных AWS зависит работа многих популярных мобильных приложений. Пока сложно сказать точно, сколько компаний пострадало из-за сбоя, но, по данным Down Detector, их может быть около 500. Список обширен и затрагивает самые разные сферы, от домашних систем видеонаблюдения до фитнес-приложений и игр.

Вот некоторые сервисы, пострадавшие из-за сегодняшнего сбоя:

  • Snapchat
  • Zoom
  • Roblox
  • Clash Royale
  • My Fitness Pal
  • Life360
  • Clash of Clans
  • Fortnite
  • Canva
  • Wordle
  • Signal
  • Coinbase
  • Duolingo
  • Slack
  • Smartsheet
  • PokemonGo
  • Epic Games
  • PlayStation Network
  • Peloton
  • Rocket League

В одном из своих обновлений Amazon сообщила, что проблема, «по-видимому, связана с разрешением DNS для конечной точки API DynamoDB в регионе US-EAST-1» (Северная Вирджиния).

DNS (Domain Name System — система доменных имен) часто сравнивают с телефонным справочником интернета. Она фактически преобразует привычные людям имена веб-сайтов в их числовые эквиваленты IP-адресов, которые могут быть прочитаны и поняты компьютерами. Этот процесс лежит в основе работы всего интернета, и любые его нарушения могут привести к тому, что веб-браузеры не смогут находить нужный пользователям контент.

Сейчас, по данным компании, наблюдаются «значительные признаки восстановления» и большинство запросов должно выполняться успешно. В 3:03 по тихоокеанскому стандартному времени (10:03 по Гринвичу) компания сообщила, что работа большинства сервисов восстановлена.

«Мы можем подтвердить, что глобальные сервисы и функции, зависящие от региона US-EAST-1, также восстановлены», — заявили в компании.

Как объясняет Том Геркен, корреспондент отдела технологий Би-би-си, некоторые сервисы могут восстанавливаться дольше, потому что во время сбоя и до него на него отправлялись запросы с локальных устройств, сейчас они все разом дошли, и системе необходимо обработать их все, что создает повышенную нагрузку.

Amazon также сообщила о проблеме с запуском так называемых «новых экземпляров EC2» — по сути, это виртуальные компьютеры, размещенные на серверах компании, со своим собственным дисковым пространством и операционной системой.

«Если вы все еще сталкиваетесь с трудностями при обращении к конечным точкам (endpoints) сервиса DynamoDB в регионе US-EAST-1, мы рекомендуем очистить кэш DNS», — призвала компания.

После того, как стали восстанавливаться сайты, пострадавшие из-за сбоя, неполадки начались на популярной форумной платформе Reddit. Некоторые пользователи, пытавшиеся открыть сабреддиты, столкнулись с уведомлением о том, что на платформе «слишком много запросов». Почему Reddit испытывает проблемы именно сейчас, когда другие платформы уже восстанавливаются, пока неясно. Неизвестно также, связано ли это со сбоем Amazon Web Services или это отдельная проблема.

За последние годы происходило несколько масштабных сбоев в работе интернет-сервисов, когда проблемы у одной компании вызывали эффект «карточного домика».

В июле 2024 года на многих компьютерах появился «синий экран смерти», который вызвал ошибочный код в программном обеспечении CrowdStrike, которое должно было обеспечивать их кибербезопасность. Около 8,5 миллионов компьютеров временно вышли из строя, что повлияло на работу множества интернет-сервисов.

В июне 2021 года множество сайтов не работало из-за проблем у американского CDN-провайдера Fastly. Тогда пострадал ряд сайтов ведущих мировых СМИ, включая BBC World Service, Guardian, Financial Times и New York Times, а также онлайн-платформы Reddit, GitHub, Twitch и другие. Был недоступен также портал британского правительства gov.uk.

В том же 2021 году, в октябре, «ошибка конфигурации» привела к отключению Facebook, Instagram и WhatsApp почти на шесть часов. Другие сайты, включая X, также испытывали сбои из-за резкого увеличения числа обращений к их приложениям.

В декабре 2020 года Gmail, YouTube, Google Drive и другие сервисы Google вышли из строя одновременно примерно на 90 минут после того, как компания столкнулась с «проблемой внутреннего лимита хранилища».