Tim Editorial BigGo
Pemadaman Besar AWS Ganggu Layanan Internet Global

Pemadaman luas di Amazon Web Services, platform komputasi awan terbesar di dunia, menyebabkan gangguan signifikan pada aplikasi populer, situs web, dan layanan penting secara global pada 20 Oktober 2025. Insiden yang berlangsung selama beberapa jam ini menyoroti ketergantungan internet yang besar pada infrastruktur awan dan memunculkan pertanyaan tentang kegagalan titik tunggal dalam ekosistem digital modern.

Cakupan Gangguan

Pemadaman AWS dimulai pada dini hari 20 Oktober 2025, dengan laporan pertama muncul sekitar pukul 03.00 EST. Gangguan dengan cepat menyebar ke berbagai benua, mempengaruhi segala hal mulai dari aplikasi hiburan hingga layanan pemerintah yang kritis. Menurut layanan pelacakan pemadaman Downdetector, laporan memuncak dengan lebih dari 13.000 keluhan pengguna di Amerika Serikat saja, sementara laporan global menunjukkan jutaan pengguna terdampak di lebih dari 1.000 perusahaan dan layanan. Insiden ini merupakan salah satu gangguan internet terbesar sejak pemadaman CrowdStrike tahun sebelumnya yang melumpuhkan bank dan bandara di seluruh dunia.

Penyebab Akar Teknis Teridentifikasi

Amazon melacak masalah ke region US-EAST-1 di Virginia, yang berfungsi sebagai pusat data asli dan terbesar perusahaan. Perusahaan mengidentifikasi masalah berasal dari cacat dalam sistem internal yang memantau kesehatan penyeimbang beban jaringan dalam infrastruktur jaringan EC2 mereka. Kegagalan teknis ini menyebabkan apa yang digambarkan AWS sebagai peningkatan tingkat kesalahan dan latensi serta kesalahan API di berbagai layanan AWS. Masalah ini sangat signifikan karena US-EAST-1 berfungsi sebagai region default bagi banyak pelanggan AWS dan mengandung kapasitas on-demand yang substansial, membuat kegagalannya sangat berdampak.

Detail Dampak Teknis:

  • Wilayah utama yang terdampak: US-EAST-1 (Northern Virginia)
  • Akar masalah: Kerusakan pada network load balancer pemantauan sistem internal yang memantau kesehatan jaringan EC2
  • Efek sekunder: Error API, peningkatan latensi, kegagalan resolusi DNS
  • Tindakan pemulihan: Disarankan melakukan flushing cache DNS, penerapan throttling permintaan, pemrosesan backlog untuk Cloudtrail dan Lambda

Dampak Layanan yang Luas

Pemadaman menciptakan efek domino di seluruh lanskap digital. Layanan konsumen populer termasuk Snapchat, Fortnite, Roblox, Coinbase, dan Signal menjadi tidak dapat diakses oleh pengguna. Layanan Amazon sendiri seperti speaker pintar Alexa, sistem keamanan Ring, dan Prime Video juga terpengaruh. Yang lebih kritis, gangguan meluas ke layanan penting termasuk laporan dampak pada layanan NHS di Inggris, institusi perbankan Inggris seperti Lloyds, dan badan pemungutan pajak Inggris HMRC. National Rail di Inggris mengarahkan penumpang ke sumber informasi alternatif karena situs web dan aplikasi mereka menjadi tidak tersedia selama insiden.

Layanan yang Terdampak Selama Gangguan AWS:

  • Sosial/Hiburan: Snapchat, Fortnite, Roblox, Coinbase, Signal, Reddit, Apple TV, Duolingo
  • Layanan Amazon: Alexa, Ring, Prime Video, Amazon Click and Collect
  • Keuangan: Venmo, Lloyds Bank
  • Layanan Pemerintah: NHS (Inggris), HMRC (otoritas pajak Inggris), National Rail (Inggris)
  • Lainnya: Instacart, Perplexity, Canva

Upaya Pemulihan dan Tantangan Berkelanjutan

AWS memulai upaya mitigasi beberapa jam setelah pemadaman, dengan perusahaan menyatakan bahwa masalah DNS telah sepenuhnya diatasi dan sebagian besar operasi layanan berhasil normal. Namun, proses pemulihan menghadapi tantangan signifikan. AWS menerapkan pembatasan permintaan untuk server virtual baru dalam upaya mempercepat proses pemulihan dan mengakui bahwa beberapa layanan sedang menangani backlog peristiwa dalam sistem seperti Cloudtrail dan Lambda. Perusahaan secara khusus mencatat bahwa permintaan untuk meluncurkan instance EC2 baru di region US-EAST-1 masih mengalami peningkatan tingkat kesalahan bahkan ketika layanan lainnya stabil.

Kronologi Pembaruan Kesehatan Layanan AWS:

  • Identifikasi masalah awal: ~pukul 3 pagi EST (20 Oktober 2025)
  • Akar masalah teridentifikasi: Masalah resolusi DNS dengan API DynamoDB di US-EAST-1
  • Mitigasi diumumkan: Beberapa jam setelah pemadaman dimulai
  • Masalah berkelanjutan: Peluncuran instance EC2 terus mengalami error setelah resolusi utama
  • Status pemulihan: Sebagian besar layanan operasional dengan beberapa pemrosesan backlog yang masih berlanjut

Implikasi Lebih Luas untuk Komputasi Awan

Insiden ini memicu kembali diskusi tentang konsentrasi infrastruktur internet dalam beberapa penyedia awan besar. Pakar keamanan siber mencatat bahwa AWS menguasai sekitar 30% pasar infrastruktur awan global, yang berarti setiap gangguan dapat memiliki konsekuensi yang meluas. Profesional industri segera mulai mengadvokasi strategi multi-awan yang lebih kuat dan perencanaan pemulihan bencana yang lebih baik. Pemadaman ini menjadi pengingat nyata tentang kerapuhan internet ketika layanan kritis sangat bergantung pada region komputasi awan tunggal dari penyedia individu.

Kekhawatiran Keamanan Selama Pemulihan

Para ahli keamanan memperingatkan bahwa periode pemulihan menghadirkan risiko tambahan di luar gangguan layanan langsung. Kepala perusahaan Check Point Software, Charlotte Wilson, mengingatkan bahwa penyerang sering memanfaatkan situasi seperti ini ketika perusahaan bergegas memulihkan akses dan sistem sedang terbebani. Dia secara khusus menyoroti potensi penawaran pengembalian dana atau diskon palsu, email phishing, dan tautan penipuan yang mengklaim dapat memperbaiki masalah. Hal ini menciptakan lanskap ancaman sekunder yang memerlukan kewaspadaan dari kedua penyedia layanan dan pengguna selama fase pemulihan.

Pelajaran untuk Kelangsungan Bisnis

Pemadaman AWS telah mendorong bisnis untuk mengevaluasi kembali ketergantungan awan dan strategi pemulihan bencana mereka. Penasihat teknologi merekomendasikan bahwa organisasi menghindari menyimpan semua infrastruktur mereka dalam satu penyedia awan dan menekankan pentingnya secara teratur menguji sistem failover. Insiden ini menunjukkan bahwa bahkan dengan infrastruktur awan yang kuat, titik kegagalan tunggal masih dapat menyebabkan gangguan bisnis yang signifikan. Seiring layanan secara bertahap kembali normal sepanjang hari, industri teknologi mulai menilai perubahan struktural apa yang mungkin diperlukan untuk mencegah pemadaman luas serupa di masa depan.