Awaria serwerów Amazona. Padła masa usług, od aplikacji przez sklepy i gry.
Na całym świecie padły usługi korzystające z infrastruktury serwerów Amazona. Fot. SEO Galaxy/Michael Dziedzic/Unsplash/kolaż.

Nie, to nie twój komputer ani dostawca internetu. Tego ranka mogłaś/eś odkryć, że nie działają ci pewne aplikacje i usługi. Powód? Globalna awaria chmury danych Amazon Web Services (AWS).

REKLAMA

Amazon potwierdził na stronie AWS globalną awarię, trwającą od około godziny 9 rano czasu polskiego. Z tej przyczyny wyłączone są sklepy i streaming Amazona, a także masa innych podmiotów i usług korzystających z ich infrastruktury.

Oficjalnie zgłoszono zażegnanie awarii w poniedziałek o 12:35 czasu polskiego, poniższy artykuł opisuje stan wcześniejszy.

Połowa internetu nie działa. Awaria AWS

"AWS padł. Będziecie mieli problemy z połową internetu, np. komunikatorem Signal" – informuje portal Niebezpiecznik na Bluesky.

Serwis Downdetector potwierdza skalę: od sklepu Amazona po aplikacje jak Duolingo, programy użytkowe i gry wideo, w tym najpopularniejszych tytułów wśród młodzieży, czyli Fortnite i Roblox. Użytkownicy zgłaszają również problemy u polskich podmiotów, jak banki i operatorzy telekomunikacyjni.

logo
Zrzut ekranu z Downdetector.pl, stan na 10:40. Fot. zrzut ekranu/Downdetector.pl

"Potwierdzamy zwiększoną liczbę błędów i opóźnienia w przypadku wielu usług AWS w regionie US-EAST-1. Ten problem może również dotyczyć tworzenia zgłoszeń za pośrednictwem Centrum pomocy technicznej AWS lub interfejsu API pomocy technicznej" – czytamy na stronie AWS. Specjaliści pracują nad przywróceniem funkcjonalności i publikują aktualizacje w interwałach 30-45 minut, możecie je śledzić tutaj.

Awaria miała miejsce w Północnej Wirginii, obszarze nazywanym "Aleją centrów danych" – to wyjątkowe zagęszczenie serwerów, stanowiących krytyczny element globalnej infrastruktury internetowej.

Dzisiejsza awaria w regionie AWS US-EAST-1 pokazuje, jak nawet największe środowiska chmurowe mogą zostać sparaliżowane przez z pozoru drobny element infrastruktury. W tym przypadku problem dotyczył DNS-a czyli fundamentu komunikacji w sieci. Kiedy przestaje działać rozwiązywanie nazw domen, całe aplikacje i usługi mogą przestać odpowiadać, niezależnie od tego, jak dobrze są zaprojektowane. To dobra lekcja dla firm korzystających z chmury: warto projektować systemy tak, aby awaria jednego regionu lub dostawcy nie zatrzymała całego biznesu. Redundancja, geograficzne rozproszenie zasobów i testowanie scenariuszy awaryjnych powinny być standardem, nie luksusem. A poza tym, jak mawiają inżynierowie, to zawsze jest DNS.

Marek Szustak

IT Security Officer w internetowym biurze podróży eSky.pl.

[AKTUALIZACJA] O godzinie 12:35 czasu polskiego Amazon informuje o zażegnaniu awarii z podkreśleniem, że "większość usług AWS powinna działać normalnie". Niektóre serwisy mogą mieć nadal małe opóźnienia, np. Reddit pozostaje nieaktywny, choć to może być z przyczyny zbyt dużej ilości powracających użytkowników naraz.