Przekonaj się sam!

Pozostaw wiadomość, a skontaktuje się z Tobą nasz dedykowany doradca.

Wyślij nam wiadomość

Adres e-mail *

NIP firmy lub nazwa (opcjonalnie)

Telefon kontaktowy (opcjonalnie)

Wielkość firmy (opcjonalnie)

Wiadomość do Opiekuna Klienta *0/10000

Globalna Awaria AWS: Jak Jeden Region Wyłączył Pół Internetu

Opublikowano: 00:00 20.10.2025

Incydenty

Jeśli w poniedziałek rano, 20 października, próbowaliście dołączyć do spotkania na Zoomie, wysłać wiadomość na Slacku lub zagrać w Fortnite, a powitał Was ekran błędu – to nie, to nie wina Waszego domowego internetu. Winowajcą jest Amazon Web Services (AWS), czyli chmurowy kręgosłup, na którym działa absurdalnie duża część globalnej sieci. W poniedziałek ten kręgosłup odmówił posłuszeństwa.

Oficjalny panel AWS Health Dashboard potwierdził „Problem operacyjny” (Operational issue) dotyczący wielu usług w regionie N. Virginia, który objawiał się „zwiększoną liczbą błędów i opóźnień”.

Epicentrum w Węźle US-EAST-1

Jak to często bywa w przypadku globalnych katastrof sieciowych, wszystko zaczęło się w jednym miejscu: regionie US-EAST-1 w Północnej Wirginii. To jeden z głównych i najstarszych węzłów sieci AWS, przez co jest też... cóż, ulubionym źródłem problemów.

Sam Amazon oficjalnie potwierdził, że badał „zwiększoną liczbę błędów i opóźnień” (Increased Error Rates and Latencies) w tym regionie, a pierwsze zgłoszenie na panelu statusu pojawiło się o 12:11 AM PDT. W świecie chmury to dyplomatyczny zwrot oznaczający „coś się bardzo, bardzo zepsuło”. Efekt domina był natychmiastowy i kaskadowo rozlał się na cały świat.

Prawdziwa Skala Awarii: Co Dokładnie Zawiodło w AWS?

Zanim przejdziemy do listy aplikacji, które przestały działać, warto spojrzeć na to, co zepsuło się „pod maską”. Awaria w US-EAST-1 nie była problemem jednej usługi, ale katastrofą kaskadową. Panel AWS Health Dashboard pokazał, że w szczytowym momencie problem bezpośrednio dotyczył 65 usług.

Problemy dotknęły absolutnie kluczowych komponentów chmury, w tym:

Bazy danych: Problemy zaczęły się od „znacznych wskaźników błędów” dla punktu końcowego bazy danych Amazon DynamoDB. Awaria dotknęła też Amazon Aurora oraz RDS (wspomniane w kontekście problemów z EC2).
Moc obliczeniowa: Wystąpiły poważne problemy z uruchamianiem nowych instancji EC2, co mogło objawiać się użytkownikom jako błąd „Insufficient Capacity Error”. To z kolei natychmiast wpłynęło na usługi zależne, takie jak ECS (Elastic Container Service) i AWS Glue.
Przetwarzanie danych i funkcje: Odnotowano opóźnienia w AWS Lambda, szczególnie w krytycznym mechanizmie mapowania zdarzeń z kolejek SQS (Simple Queue Service).
Globalne usługi: Awaria w jednym regionie wpłynęła nawet na globalne funkcje, które polegają na US-EAST-1, takie jak aktualizacje IAM (zarządzanie tożsamością i dostępem) oraz globalne tabele DynamoDB.
Inne kluczowe usługi: Lista była długa i obejmowała też m.in. Amazon CloudFront (CDN), Amazon S3 (Simple Storage Service), AWS Secrets Manager, Amazon Redshift, Amazon SageMaker, Amazon OpenSearch Service, Amazon Kinesis, Amazon SES (Simple Email Service) oraz AWS Storage Gateway.

Co ciekawe, awaria była tak dotkliwa, że klienci „mogli nie być w stanie tworzyć ani aktualizować zgłoszeń do wsparcia technicznego” (Support Cases).

Skala Paraliżu: Od Komunikatorów po Banki

Dla przeciętnego użytkownika oznaczało to, że serwis Downdetector dosłownie zapłonął. Jednoczesne piki zgłoszeń dotyczyły usług z niemal każdej możliwej kategorii. Awaria unaoczniła, jak wiele procesów – od pracy po rozrywkę – powierzyliśmy jednej firmie.

Lista poszkodowanych wygląda jak spis gości na imprezie „kto jest kim w internecie”:

Biznes i Praca: Tysiące firm stanęło w miejscu. Nie działały kluczowe narzędzia komunikacyjne jak Slack, Zoom czy Asana. Padły też usługi Atlassian oraz Smartsheet.
Rozrywka i Gry: Gracze zostali wyrzuceni z serwerów Fortnite, Roblox, Clash Royale oraz Epic Games Store. Fani muzyki stracili dostęp do Tidala.
Finanse (Fintech): Chwile grozy przeżyli użytkownicy giełd krypto (np. Coinbase), aplikacji do tradingu (jak Robinhood) oraz systemów płatności (m.in. Venmo). Problemy zgłaszały nawet tradycyjne banki, jak brytyjskie Lloyds i Halifax.
Aplikacje Codzienne: Nie dało się zamówić burgera przez aplikację McDonald’s, zaprojektować grafiki w Canva, pouczyć się języka w Duolingo, wysłać wiadomości przez Signal, sprawdzić czegoś w Perplexity ani użyć Grammarly czy Snapchata.
Samo Podwórko Amazona: Awaria uderzyła też w samego giganta. Problemy miały sklep Amazon.com, streaming Prime Video oraz urządzenia IoT – inteligentne głośniki Alexa głuchły, a dzwonki Ring nie wysyłały powiadomień.
Inne usługi i IoT: Padły serwery Autodesk, Supabase, a nawet systemy autoryzacji Docker.io. Użytkownicy zgłaszali, że nie działają ich odkurzacze iRobot (Roomba), inteligentne zamki do drzwi (Amazon), smart plugi (inteligentne gniazdka Amazon) oraz wideo domofony (Ring).
Media: Nawet największe serwisy informacyjne, jak The New York Times, BBC czy platformy Disneya, odnotowały przerwy w działaniu.

Co Nawaliło? Stary Znajomy, DNS

Według oficjalnych komunikatów AWS, przyczyną całego zamieszania była awaria systemu DNS.

Dokładnie o 2:01 AM PDT Amazon zidentyfikował „potencjalną główną przyczynę”. Problem był „związany z rozpoznawaniem DNS (DNS resolution) dla punktu końcowego API DynamoDB w regionie US-EAST-1”.

Mówiąc prościej: DNS to cyfrowa książka telefoniczna internetu. Tłumaczy zrozumiałe dla ludzi adresy (np. google.com) na numery IP zrozumiałe dla maszyn. Gdy ten system zawodzi, usługi nie potrafią się wzajemnie „znaleźć”. Serwery próbują się ze sobą skomunikować, ale nikt nie odbiera telefonu. A ponieważ DynamoDB jest fundamentalną bazą danych dla wielu innych usług AWS, jego awaria pociągnęła za sobą resztę.

Proces odzyskiwania był wieloetapowy:

12:11 AM PDT (9:11 czasu polskiego): Amazon rozpoczyna badanie sprawy.
12:51 AM PDT (9:51 czasu polskiego): Potwierdzenie „zwiększonej liczby błędów i opóźnień” w US-EAST-1.
1:26 AM PDT (10:26 czasu polskiego): Amazon potwierdza „znaczne wskaźniki błędów” dla DynamoDB.
2:01 AM PDT (11:01 czasu polskiego): Zidentyfikowano główną przyczynę: problem z DNS dla API DynamoDB.
2:22 AM PDT (11:22 czasu polskiego): Wdrożono „wstępne środki zaradcze” (initial mitigations) i zaobserwowano „wczesne oznaki ożywienia”. Klientom zalecono ponawianie nieudanych żądań.
2:27 AM PDT (11:27 czasu polskiego): Amazon ogłasza „znaczące oznaki ożywienia”, większość żądań powinna już działać.
3:03 AM PDT (12:03 czasu polskiego): Amazon potwierdza, że globalne usługi zależne od US-EAST-1 również wracają do normy.
3:35 AM PDT (12:35 czasu polskiego): Amazon ogłosił, że „podstawowy problem z DNS został w pełni złagodzony”, a „większość operacji usług AWS działała już normalnie”.

Jednak, jak to bywa przy tak dużej awarii, nie wszystko wróciło do normy od razu. AWS przyznał, że niektóre usługi, jak CloudTrail i Lambda, nadal „przerabiały zaległości zdarzeń”. Co więcej, nawet po naprawie DNS, nadal występowały „zwiększone wskaźniki błędów” przy próbach uruchamiania nowych instancji EC2 w US-EAST-1.

Jeszcze o 4:48 AM PDT (13:48 czasu polskiego) Amazon wciąż pracował nad pełnym przywróceniem uruchamiania EC2 i zalecał klientom, by ich grupy Auto Scaling były skonfigurowane do używania wielu Stref Dostępności (Availability Zones). Potwierdzono też, że opóźnienia w Lambda/SQS wpływały m.in. na „aktualizacje zasad Organizacji” (Organization policy updates).

O 5:10 AM PDT (14:10 czasu polskiego) potwierdzono odzyskanie przetwarzania kolejek SQS przez Lambda, ale wciąż pracowano nad „przetwarzaniem zaległości wiadomości SQS w kolejkach Lambda”.

Jako jedno z zaleceń, AWS sugerował klientom, którzy nadal mieli problemy z DynamoDB, „przepłukanie swoich pamięci podręcznych DNS”.

Lekcja o Zależności (Po Raz Kolejny)

Incydent z 20 października 2025 to jeden z największych globalnych przestojów AWS od kilku lat. To także kolejny zimny prysznic, który brutalnie uświadomił globalnej gospodarce, jak bardzo jest uzależniona od jednego dostawcy.

AWS kontroluje około 30% całego rynku infrastruktury chmurowej. To gigant, na którego fundamentach stoją konkurenci, media, rządy i systemy finansowe. Mówiąc kolokwialnie: gdy AWS kicha, cały internet ma katar.

Awaria rodzi też pytania, które zadał artykuł Niebezpiecznik.pl: „Co robić, jak żyć?”. To idealny moment na zastanowienie się, „czy na pewno w Waszych organizacjach istnieje awaryjna procedura na wypadek braku jakiegoś krytycznego dla biznesu narzędzia/usługi?”. I czy „każdy z pracowników wie, czego użyć do spotkania online/komunikacji, kiedy np. pada firmowy Zoom lub Signal?”.

Źródła:

Aleksander

Przeczytaj także: Chmura w sektorach strategicznych - szansa czy ryzyko? oraz Awaria Cloudflare - czarna jesień internetu.

O autorze

Aleksander Zębrowski

Dyrektor ds. Technologii w SecurHub.pl

Doktorant z zakresu neuronauki poznawczej. Psycholog i ekspert IT specjalizujący się w cyberbezpieczeństwie.

Odwiedź stronę

Udostępnij:

Powiązane artykuły

Incydenty

Paraliż Płatności w Polsce: Ogromna Awaria Terminali PayTel

W poniedziałek doszło do ogólnopolskiej awarii terminali płatniczych firmy PayTel. Przez kilka godzin klienci w całej Polsce nie mogli płacić kartą, co wywołało chaos w handlu i usługach.

29.09.2025

3 min

Incydenty

Weekend z Gotówką: Ogólnopolska Awaria Terminali Płatniczych. Atak czy Zwykła Awar-ia?

Wielu Polaków przeżyło cyfrowy detoks, gdy w miniony weekend padły terminale płatnicze w całym kraju. Oficjalnie to „problemy techniczne”, ale w kuluarach mówi się o cyberataku.

23.09.2025

4 min

Incydenty

Polska sparaliżowana? Awaria terminali płatniczych wywołała chaos, ale to nie cyberatak!

W sobotę 13 września w Polsce doszło do masowej awarii terminali płatniczych firmy eService, która uniemożliwiła płatności kartą i BLIK-iem w wielu sklepach. Choć początkowo obawiano się ataku hakerów, ministerstwo cyfryzacji uspokoiło, że problem miał charakter techniczny.

15.09.2025

4 min

Komentarze

Ładowanie komentarzy...

Globalna Awaria AWS: Jak Jeden Region Wyłączył Pół Internetu

Opublikowano: 00:00 20.10.2025

Incydenty

Epicentrum w Węźle US-EAST-1

Prawdziwa Skala Awarii: Co Dokładnie Zawiodło w AWS?

Problemy dotknęły absolutnie kluczowych komponentów chmury, w tym:

Bazy danych: Problemy zaczęły się od „znacznych wskaźników błędów” dla punktu końcowego bazy danych Amazon DynamoDB. Awaria dotknęła też Amazon Aurora oraz RDS (wspomniane w kontekście problemów z EC2).
Moc obliczeniowa: Wystąpiły poważne problemy z uruchamianiem nowych instancji EC2, co mogło objawiać się użytkownikom jako błąd „Insufficient Capacity Error”. To z kolei natychmiast wpłynęło na usługi zależne, takie jak ECS (Elastic Container Service) i AWS Glue.
Przetwarzanie danych i funkcje: Odnotowano opóźnienia w AWS Lambda, szczególnie w krytycznym mechanizmie mapowania zdarzeń z kolejek SQS (Simple Queue Service).
Globalne usługi: Awaria w jednym regionie wpłynęła nawet na globalne funkcje, które polegają na US-EAST-1, takie jak aktualizacje IAM (zarządzanie tożsamością i dostępem) oraz globalne tabele DynamoDB.
Inne kluczowe usługi: Lista była długa i obejmowała też m.in. Amazon CloudFront (CDN), Amazon S3 (Simple Storage Service), AWS Secrets Manager, Amazon Redshift, Amazon SageMaker, Amazon OpenSearch Service, Amazon Kinesis, Amazon SES (Simple Email Service) oraz AWS Storage Gateway.

Co ciekawe, awaria była tak dotkliwa, że klienci „mogli nie być w stanie tworzyć ani aktualizować zgłoszeń do wsparcia technicznego” (Support Cases).

Skala Paraliżu: Od Komunikatorów po Banki

Lista poszkodowanych wygląda jak spis gości na imprezie „kto jest kim w internecie”:

Biznes i Praca: Tysiące firm stanęło w miejscu. Nie działały kluczowe narzędzia komunikacyjne jak Slack, Zoom czy Asana. Padły też usługi Atlassian oraz Smartsheet.
Rozrywka i Gry: Gracze zostali wyrzuceni z serwerów Fortnite, Roblox, Clash Royale oraz Epic Games Store. Fani muzyki stracili dostęp do Tidala.
Finanse (Fintech): Chwile grozy przeżyli użytkownicy giełd krypto (np. Coinbase), aplikacji do tradingu (jak Robinhood) oraz systemów płatności (m.in. Venmo). Problemy zgłaszały nawet tradycyjne banki, jak brytyjskie Lloyds i Halifax.
Aplikacje Codzienne: Nie dało się zamówić burgera przez aplikację McDonald’s, zaprojektować grafiki w Canva, pouczyć się języka w Duolingo, wysłać wiadomości przez Signal, sprawdzić czegoś w Perplexity ani użyć Grammarly czy Snapchata.
Samo Podwórko Amazona: Awaria uderzyła też w samego giganta. Problemy miały sklep Amazon.com, streaming Prime Video oraz urządzenia IoT – inteligentne głośniki Alexa głuchły, a dzwonki Ring nie wysyłały powiadomień.
Inne usługi i IoT: Padły serwery Autodesk, Supabase, a nawet systemy autoryzacji Docker.io. Użytkownicy zgłaszali, że nie działają ich odkurzacze iRobot (Roomba), inteligentne zamki do drzwi (Amazon), smart plugi (inteligentne gniazdka Amazon) oraz wideo domofony (Ring).
Media: Nawet największe serwisy informacyjne, jak The New York Times, BBC czy platformy Disneya, odnotowały przerwy w działaniu.

Co Nawaliło? Stary Znajomy, DNS

Według oficjalnych komunikatów AWS, przyczyną całego zamieszania była awaria systemu DNS.

Proces odzyskiwania był wieloetapowy:

12:11 AM PDT (9:11 czasu polskiego): Amazon rozpoczyna badanie sprawy.
12:51 AM PDT (9:51 czasu polskiego): Potwierdzenie „zwiększonej liczby błędów i opóźnień” w US-EAST-1.
1:26 AM PDT (10:26 czasu polskiego): Amazon potwierdza „znaczne wskaźniki błędów” dla DynamoDB.
2:01 AM PDT (11:01 czasu polskiego): Zidentyfikowano główną przyczynę: problem z DNS dla API DynamoDB.
2:22 AM PDT (11:22 czasu polskiego): Wdrożono „wstępne środki zaradcze” (initial mitigations) i zaobserwowano „wczesne oznaki ożywienia”. Klientom zalecono ponawianie nieudanych żądań.
2:27 AM PDT (11:27 czasu polskiego): Amazon ogłasza „znaczące oznaki ożywienia”, większość żądań powinna już działać.
3:03 AM PDT (12:03 czasu polskiego): Amazon potwierdza, że globalne usługi zależne od US-EAST-1 również wracają do normy.
3:35 AM PDT (12:35 czasu polskiego): Amazon ogłosił, że „podstawowy problem z DNS został w pełni złagodzony”, a „większość operacji usług AWS działała już normalnie”.

O 5:10 AM PDT (14:10 czasu polskiego) potwierdzono odzyskanie przetwarzania kolejek SQS przez Lambda, ale wciąż pracowano nad „przetwarzaniem zaległości wiadomości SQS w kolejkach Lambda”.

Jako jedno z zaleceń, AWS sugerował klientom, którzy nadal mieli problemy z DynamoDB, „przepłukanie swoich pamięci podręcznych DNS”.

Lekcja o Zależności (Po Raz Kolejny)

Źródła:

Aleksander

Przeczytaj także: Chmura w sektorach strategicznych - szansa czy ryzyko? oraz Awaria Cloudflare - czarna jesień internetu.

O autorze

Aleksander Zębrowski

Dyrektor ds. Technologii w SecurHub.pl

Doktorant z zakresu neuronauki poznawczej. Psycholog i ekspert IT specjalizujący się w cyberbezpieczeństwie.

Odwiedź stronę

Udostępnij:

Powiązane artykuły

Incydenty

Paraliż Płatności w Polsce: Ogromna Awaria Terminali PayTel

W poniedziałek doszło do ogólnopolskiej awarii terminali płatniczych firmy PayTel. Przez kilka godzin klienci w całej Polsce nie mogli płacić kartą, co wywołało chaos w handlu i usługach.

29.09.2025

3 min

Incydenty

Weekend z Gotówką: Ogólnopolska Awaria Terminali Płatniczych. Atak czy Zwykła Awar-ia?

Wielu Polaków przeżyło cyfrowy detoks, gdy w miniony weekend padły terminale płatnicze w całym kraju. Oficjalnie to „problemy techniczne”, ale w kuluarach mówi się o cyberataku.

23.09.2025

4 min

Incydenty

Polska sparaliżowana? Awaria terminali płatniczych wywołała chaos, ale to nie cyberatak!

15.09.2025

4 min

Komentarze

Ładowanie komentarzy...