Data Center Newark Linode Mengalami Gangguan 24 Jam Setelah Kegagalan Sistem Listrik dan Pendingin

Tim Komunitas BigGo
Data Center Newark Linode Mengalami Gangguan 24 Jam Setelah Kegagalan Sistem Listrik dan Pendingin

Gangguan besar di data center US-East Newark milik Linode telah membuat ribuan pelanggan kehilangan akses ke layanan cloud mereka selama lebih dari 24 jam, menandai salah satu gangguan paling signifikan dalam sejarah terbaru perusahaan. Insiden yang dimulai pada 27 Juli 2025 pukul 10:08 UTC ini dipicu oleh pemadaman listrik yang menyebabkan kegagalan berantai pada sistem pemanas dan pendingin fasilitas.

Timeline Pemadaman:

  • 27 Juli 2025 10:08 UTC: Insiden awal dilaporkan
  • 27 Juli 2025 13:59 UTC: Akar masalah teridentifikasi (pemadaman listrik yang mempengaruhi HVAC)
  • 27 Juli 2025 14:13 UTC: Block Storage dipulihkan
  • 27 Juli 2025 17:52 UTC: Object Storage dipulihkan
  • 27 Juli 2025 19:00 UTC: NodeBalancers dipulihkan
  • 28 Juli 2025 10:50 UTC: Pembaruan terbaru (berlangsung 24+ jam)

Downtime yang Berkepanjangan Membuat Pengguna Bisnis Frustasi

Sifat berkepanjangan dari gangguan ini secara khusus berdampak pada bisnis yang mengandalkan Linode untuk infrastruktur kritis. Banyak pengguna melaporkan kehilangan akses total ke virtual private server mereka, dengan beberapa mengalami pemulihan parsial yang diikuti oleh kegagalan tambahan. Server email, layanan DNS, dan website yang menghadap pelanggan telah offline, menyebabkan gangguan bisnis yang signifikan.

Respons komunitas mengungkapkan dampak dunia nyata dari downtime yang berkepanjangan seperti ini. Seorang pengguna mencatat pengalaman mereka dengan infrastruktur yang tersebar di beberapa penyedia, menyoroti bagaimana bahkan pengaturan redundan tidak dapat sepenuhnya melindungi bisnis dari gangguan regional dengan skala besar seperti ini.

Kesenjangan Komunikasi Menambah Kekhawatiran Pelanggan

Selain masalah teknis, pelanggan telah menyatakan frustrasi dengan komunikasi Linode selama krisis. Butuh waktu sekitar empat jam bagi perusahaan untuk mengidentifikasi dan mengkomunikasikan bahwa akar penyebabnya terkait dengan komplikasi listrik dan HVAC. Sejak saat itu, pembaruan status sebagian besar berulang, menawarkan sedikit informasi konkret tentang kemajuan pemulihan atau jadwal waktu.

Kami mendekati 24 jam downtime, saya masih salah satu yang terdampak dan saya mulai bertanya-tanya apakah situasinya lebih buruk dari yang mereka biarkan kita ketahui.

Pola komunikasi ini telah membuat beberapa pengguna mempertanyakan apakah ruang lingkup penuh masalah sedang diungkapkan, terutama mengingat durasi gangguan yang tidak biasa untuk penyedia cloud besar.

Dampak Layanan yang Meluas Melampaui Newark

Yang dimulai sebagai masalah data center Newark yang terlokalisasi meluas hingga mempengaruhi layanan Linode Kubernetes Engine (LKE) di beberapa wilayah, termasuk Dallas , Fremont , Sydney , Tokyo 2 , Toronto , dan Washington . Dampak lintas wilayah ini menunjukkan betapa saling terhubungnya infrastruktur cloud modern, di mana masalah di satu fasilitas dapat menyebar ke seluruh benua.

Gangguan mempengaruhi hampir semua layanan Linode di wilayah Newark , termasuk Block Storage , Object Storage , NodeBalancers , Backups , dan Metadata Service . Pemulihan telah berlangsung bertahap dan tidak merata, dengan beberapa layanan seperti Block Storage dan Object Storage dipulihkan berjam-jam sebelum yang lain.

Layanan yang Terdampak:

  • Semua instance Linode di wilayah Newark
  • Block Storage (telah dipulihkan)
  • Object Storage (telah dipulihkan)
  • NodeBalancers (telah dipulihkan)
  • Backups
  • Metadata Service
  • Longview
  • Dampak LKE lintas wilayah: Dallas , Fremont , Sydney , Tokyo 2 , Toronto , Washington

Kemajuan Pemulihan Tetap Lambat

Berdasarkan pembaruan terbaru, para ahli materi pelajaran Linode terus bekerja untuk memulihkan layanan yang tersisa, tetapi kemajuan tampak bertahap. Beberapa pengguna melaporkan melihat tanda-tanda kehidupan dari server individual, sementara yang lain tetap sepenuhnya offline. Perusahaan telah memulihkan beberapa layanan secara bertahap, dengan NodeBalancers pulih sekitar pukul 19:00 UTC pada 27 Juli, diikuti oleh Block Storage pada pukul 14:13 UTC dan Object Storage pada pukul 17:52 UTC.

Insiden ini berfungsi sebagai pengingat yang jelas tentang risiko yang terkait dengan deployment wilayah tunggal dan pentingnya strategi multi-cloud untuk aplikasi misi kritis. Bagi banyak pelanggan yang terdampak, gangguan ini merepresentasikan pengalaman terpanjang mereka dengan downtime dari penyedia hosting mana pun, menimbulkan pertanyaan tentang perjanjian tingkat layanan dan kebijakan kompensasi.

HVAC: Sistem Heating, Ventilation, and Air Conditioning yang mempertahankan suhu dan kelembaban optimal di data center LKE: Linode Kubernetes Engine , layanan orkestrasi kontainer yang dikelola

Referensi: Service Issue - All Services - US-EAST (Newark) Incident Report for Linode