Серверы, хранящие терабайты данных, могут быть остановлены удивительно простыми вещами. Роковая случайность или человеческая оплошность — и катастрофа неминуема. В одно мгновение могут потеряться данные, клиенты и репутация. Наша подборка историй — это напоминание о том, что в IT нет неважных деталей. В 2017 году масштабный сбой в работе Amazon Web Services (AWS), одного из самых надёжных облачных провайдеров, парализовал тысячи сервисов по всему миру. Причиной стала простая опечатка. Сотрудник команды поддержки S3 (облачного хранилища AWS) пытался устранить проблему с производительностью. Для этого он ввёл команду в консоли. Но вместо того, чтобы указать три сервера, он случайно ввёл команду, затрагивающую тысячи. Один лишний символ — и система начала массовое отключение критически важных узлов. В результате сервис S3, на котором держались сайты, приложения и базы данных сотен компаний, перестал отвечать. Сервисы вроде Slack, Trello и некоторые внутренние системы Amazon оказались в оф
Истории серверных катастроф: как компании теряли данные из-за мелочей
3 сентября 20253 сен 2025
42
3 мин