Сбой Amazon AWS нарушает глобальную сеть, поскольку приложения, банки и авиакомпании отключаются от сети: что именно произошло?

Массовый сбой в Amazon Web Services (AWS) в понедельник вызвал массовые сбои в работе Интернета, в результате чего были отключены основные приложения, веб-сайты и онлайн-инструменты, используемые миллионами людей по всему миру. Услуги были постепенно восстановлены через несколько часов, но этот инцидент подчеркнул, насколько сильно современная цифровая инфраструктура зависит от сети облачных вычислений Amazon.

Сбой начался около 07:11 по Гринвичу, когда в AWS произошел сбой в одном из крупнейших центров обработки данных в Вирджинии. Проблема возникла из-за ошибочного обновления API DynamoDB, одного из основных сервисов баз данных AWS, в котором хранятся критически важные данные для многочисленных онлайн-платформ.

Сообщается, что обновление затронуло систему доменных имен (DNS), которая действует как телефонная книга в Интернете, преобразуя имена веб-сайтов в числовые IP-адреса. Когда DNS давал сбой, приложения не могли обнаружить серверы DynamoDB, что приводило к массовым сбоям в работе 113 сервисов AWS.

К 10:11 по Гринвичу Amazon объявила, что большинство систем снова заработало, но предупредила, что обработка накопившихся сообщений потребует дополнительного времени. Несмотря на исправление, пользователи продолжали сообщать о проблемах на таких платформах, как OpenAI, ESPN и Apple Music, через Downdetector, сайт, который отслеживает сбои в работе сети.

Amazon объяснил проблему технической ошибкой во время планового обновления. Сбой нанес ущерб многим компаниям, которые полагаются на AWS для облачных вычислений, веб-хостинга и хранения данных. Среди пострадавших были Snapchat, Pinterest, Apple TV, WhatsApp, Signal, Zoom, Slack, Roblox, Fortnite, Starbucks, Etsy и Venmo.

Некоторые пользователи также обнаружили, что их дверные звонки Ring и устройства Alexa отключены от сети, в то время как загрузка Kindle и даже сам веб-сайт Amazon столкнулись с перебоями. Крупнейшие средства массовой информации, такие как The New York Times, The Wall Street Journal и Associated Press, также сообщили о временных сбоях.

В Соединенных Штатах финансовые учреждения и авиакомпании, включая Delta и United, столкнулись с операционными проблемами. Криптовалютная биржа Coinbase и компания Perplexity, занимающаяся искусственным интеллектом, оказались среди других крупных технологических платформ, подвергшихся воздействию.

Масштабы сбоя усугублялись доминированием AWS на мировом рынке облачных услуг. Многие компании используют вычислительные мощности и возможности хранения данных AWS для запуска своих приложений. Когда одна из основных систем вышла из строя, последствия распространились на тысячи зависимых служб.

Amazon подтвердила, что ее инженеры «немедленно включились» в работу, как только начался сбой, и работали над «несколько параллельных путей для ускорения восстановления». Компания заявила, что основная проблема решена, и пообещала опубликовать подробный отчет по итогам мероприятия, чтобы объяснить, что пошло не так.

Хотя отключение было временным, оно послужило напоминанием о том, насколько большая часть цифрового мира стала зависеть от нескольких крупных облачных провайдеров и как единственная техническая ошибка может за считанные секунды распространиться по глобальным системам.