11 августа 2016 года Reddit не был доступен в период с 05:24 до 06:52, а в период с 06:52 до 08:19 имел проблемы с производительностью. Проблема затронула все официальные платформы Reddit и API, обслуживающие сторонние приложения. Простой был вызван ошибкой, возникшей во время миграции критической составляющей бэкенда. В результате инцидента данные потеряны не были. Причина ошибки. Reddit использует Zookeeper для мониторинга работы серверов. Также используется система автомасштабирования для обеспечения необходимого числа серверов, зависящего от нагрузки на систему. Часть обновлений инфраструктуры включала в себя миграцию Zookeeper на более современную платформу, внутри облаков Amazon. Так как система автомасштабирования получает данные напрямую из Zookeeper, то на время миграции она была отключена, чтобы у нее не возникало путаницы в том, какие сервера должны быть доступны. Однако, в 05:23 система была неожиданно запущена менеджером пакетов, заметившим ручное изменение ко