Сбой в AWS вызвал сбои в работе Signal, Snapchat, Fortnite и ChatGPT

Главное:

Сбой в работе AWS в центре обработки данных Северной Вирджинии затронул сотни популярных сервисов по всему миру.
Причиной инцидента стала проблема с разрешением API DynamoDB в регионе US-EAST-1.
Восстановление нормальной работы серверов заняло около двух часов.

В одном из ключевых дата-центров Amazon Web Services, расположенном в Северной Вирджинии, произошёл масштабный сбой, который отразился на функционировании множества известных онлайн-сервисов и приложений. AWS оперативно сообщила, что причиной инцидента стала неисправность в работе API базы данных DynamoDB на территории региона US-EAST-1, что вызвало сбои в разрешении запросов к этому сервису.

Производитель облачной инфраструктуры сообщил, что после выявления проблемы началась работа по её устранению с использованием нескольких параллельных направлений для ускорения восстановления нормальной работы. Несмотря на сложности, спустя примерно два часа сбой был значительно локализован, и большинство запросов начали обрабатываться успешно. При этом часть накопившихся запросов продолжала находиться в очереди на обработку.

В результате сбоя пострадали многочисленные популярные сервисы, среди которых оказались Airtable, Canva, Signal, Snapchat, Fortnite, ChatGPT, Duolingo, Zoom, Ring, Hulu, Lyft, Perplexity, Slack, Reddit, Roblox, а также приложения финансовых и развлекательных компаний, включая Coinbase, Robinhood, McDonald’s, United Airlines и Disney. У пользователей также возникли проблемы с работой умных колонок Alexa, которые массово сообщали о недоступности интернета.

Данный инцидент оказался наглядным примером того, насколько критически важна стабильная работа облачных сервисов и инфраструктуры для современного цифрового мира, в котором множество сервисов и приложений зависят от бесперебойной работы облачных платформ.