
Credit image: Freepix
Kekacauan Global Situs Populer Error Massal – Layanan komputasi awan terbesar di dunia, Amazon Web Services (AWS), mengalami gangguan besar yang melumpuhkan jutaan situs web dan layanan populer di seluruh dunia.
Insiden ini berpusat pada Region AWS US-EAST-1 (Virginia Utara, AS), yang merupakan pusat data AWS tertua dan tersibuk, yang berujung pada efek domino yang terasa hingga ke Eropa dan kawasan lain.
Gangguan ini dimulai pada Senin, 20 Oktober 2025 (waktu setempat), dan memengaruhi segala hal mulai dari e-commerce, streaming, gaming, hingga layanan pendidikan.
Kronologi Gangguan dan Penyebab Awal
Menurut pembaruan status dari AWS, masalah ini awalnya teridentifikasi sebagai peningkatan signifikan dalam tingkat kesalahan (error rates) dan latensi untuk berbagai layanan di Region US-EAST-1.
DNS dan DynamoDB
Setelah penyelidikan awal, AWS mengonfirmasi bahwa akar masalah yang potensial terkait dengan isu resolusi DNS (Domain Name System) untuk endpoint API layanan DynamoDB.
DynamoDB adalah layanan database kunci AWS yang digunakan oleh banyak aplikasi untuk menyimpan data penting dan sering disebut sebagai “pencatat rekor di internet modern.
Ketika terjadi masalah resolusi DNS seperti “buku telepon internet” yang gagal menerjemahkan nama situs menjadi alamat IP yang dapat dibaca komputer.
Aplikasi yang bergantung pada DynamoDB tidak dapat menemukan database mereka, menyebabkan kegagalan berantai.

Pemulihan yang Bertahap
Gangguan awal yang parah berlangsung sekitar 45 menit hingga satu jam, namun dampak lanjutan berlangsung lebih lama.
- Pembaruan Awal (Dini Hari EDT): AWS menyatakan telah menerapkan mitigasi awal dan melihat tanda-tanda pemulihan, namun pelanggan disarankan untuk terus mencoba kembali (retry) permintaan yang gagal.
- Komplikasi Lanjutan: Setelah mitigasi isu DNS DynamoDB, masalah baru muncul. AWS melaporkan adanya masalah dengan Network Load Balancers internal, yang bertanggung jawab memantau kesehatan server mereka. Ini memperpanjang gangguan dan terus menyebabkan masalah konektivitas bagi banyak perusahaan.
Dari Game Hingga Keuangan
Karena US-EAST-1 adalah pusat yang sangat penting, gangguan ini dengan cepat meluas secara global, memengaruhi layanan yang secara teknis berada di seluruh dunia.
Namun memiliki dependensi autentikasi atau kontrol pusat di region tersebut (misalnya, pembaruan IAM/manajemen identitas).
Berikut adalah daftar layanan utama yang mengalami pemadaman atau gangguan:
- Amazon.com (situs utama), Prime Video, Hulu
- Fortnite (masalah login), Roblox, Clash of Clans, Clash of Royals, Palworld
- Snapchat, Perplexity AI
- Canva (masalah edit gambar), Canvas (platform sekolah AS), Grammarly
- Robinhood (aplikasi trading), Coinbase (pertukaran kripto), bank-bank besar di Inggris (seperti Lloyds)
Epic Games (Fortnite), Perplexity AI, dan Canva semuanya mengonfirmasi gangguan layanan mereka melalui media sosial dan halaman status.
Dengan terganggunya semua lini dan sektor, ini menunjukkan betapa sentralnya peran AWS dalam infrastruktur digital mereka.
Baca juga: Pentingnya Tim dan Respons yang Tepat dalam Keamanan Siber |
Biaya dan Risiko Ketergantungan Tunggal
Insiden ini kembali menyoroti risiko besar dari konsentrasi layanan komputasi awan pada segelintir penyedia dominan (AWS, Azure, Google Cloud).
Kerugian Finansial
Meskipun pemadaman hanya berlangsung beberapa jam, estimasi kerugian finansial per jam untuk perusahaan besar sangat mengejutkan.
Beberapa perkiraan menunjukkan bahwa layanan besar dapat menelan kerugian jutaan dolar per jam, dengan Amazon sendiri diperkirakan mengalami kerugian hingga lebih dari $70 juta per jam di puncaknya.
Pelajaran untuk Semua Perusahaan
Para ahli teknologi menekankan bahwa masalah ini bukan hanya kegagalan teknis AWS, tetapi juga pengingat bagi perusahaan yang menggunakan cloud.
- Perusahaan harus merancang aplikasi dengan redundansi di lebih dari satu region AWS atau bahkan penyedia cloud yang berbeda (multi-cloud) untuk mencegah kegagalan tunggal melumpuhkan seluruh operasi mereka.
- Layanan global yang penting (seperti otentikasi/IAM) yang beroperasi hanya dari US-EAST-1 terbukti menjadi titik kegagalan tunggal (single point of failure), yang harus dihindari.
Meskipun layanan dinyatakan pulih sepenuhnya (sekitar pukul 12:06 PM EDT), dampak “pemulihan tunda” (backlog) membuat banyak layanan membutuhkan waktu lebih lama untuk benar-benar normal, khususnya bagi pengguna yang berada di zona waktu berbeda.
Insiden ini menjadi bukti nyata kerapuhan internet modern yang sangat bergantung pada satu simpul infrastruktur raksasa.
Sumber berita: