Stack Software ROCm AMD Masih Berjuang Meski Ada Kemajuan Hardware MI300X

Tim Editorial BigGo
Stack Software ROCm AMD Masih Berjuang Meski Ada Kemajuan Hardware MI300X

AMD terus menghadapi tantangan signifikan dengan ekosistem perangkat lunaknya meski telah membuat kemajuan mengesankan dalam pengembangan perangkat keras AI. Sementara perusahaan telah meluncurkan akselerator MI300X yang powerful dan platform ROCm 7 yang baru, feedback komunitas mengungkap masalah dukungan perangkat lunak yang persisten yang mungkin menghambat kemampuan AMD untuk bersaing secara efektif dengan NVIDIA di pasar AI.

Spesifikasi Utama AMD MI300X:

  • Hingga 192GB memori HBM3 (lebih banyak dari akselerator AI lainnya)
  • Hingga 896 GB/s bandwidth memori
  • Delapan chiplet akselerator berbasis AMD CDNA 3
  • Mengklaim hingga 8x performa AI vs MI250X
  • Mengklaim hingga 2x bandwidth memori vs NVIDIA H100
  • Ketersediaan: Q4 2023

Dukungan Perangkat Lunak Masih Tidak Konsisten

Masalah inti yang mengganggu ambisi AI AMD berpusat pada performa perangkat lunak yang tidak konsisten. Banyak developer melaporkan bahwa dukungan ROCm bervariasi secara dramatis tergantung pada kasus penggunaan spesifik, dengan beberapa aplikasi bekerja dengan lancar sementara yang lain mengalami masalah signifikan. Ketidakpastian ini telah membuat banyak pengguna meninggalkan solusi AMD demi ekosistem CUDA NVIDIA yang lebih andal, meski ada potensi keuntungan performa dari perangkat keras AMD.

Situasi menjadi lebih mengkhawatirkan ketika memeriksa dukungan GPU konsumen. AMD secara historis memberikan dukungan yang meragukan untuk kartu konsumen mereka dalam beban kerja AI, menciptakan hambatan bagi mahasiswa, peneliti, dan developer kecil yang tidak mampu membeli perangkat keras kelas datacenter. Pendekatan ini sangat kontras dengan strategi NVIDIA yang memastikan CUDA bekerja di seluruh lini produk mereka.

Fitur Platform ROCm 7:

  • HIP untuk migrasi CUDA yang mudah
  • Dukungan Python dan alat pemodelan baru
  • Suite software Presidio dengan analyzer performa model
  • Compiler dan runtime engine sudah termasuk
  • Dirancang untuk transisi hardware AMD yang lebih mudah
  • Dukungan GPU konsumen dijanjikan untuk rilis mendatang

Masalah Pipeline Akademik

Kelemahan kritis dalam strategi AMD tampaknya adalah fokus terbatas mereka pada membangun basis pengguna akademik. Universitas dan institusi penelitian sering mengandalkan perangkat keras yang lebih lama dan terjangkau, menciptakan peluang bagi AMD untuk membangun mindshare di antara profesional AI masa depan. Namun, penekanan perusahaan pada solusi datacenter high-end berarti mereka kehilangan kesempatan untuk menempatkan tools mereka di tangan mahasiswa pascasarjana yang pada akhirnya akan mempengaruhi keputusan pembelian enterprise.

Kesenjangan ekosistem perangkat lunak meluas melampaui fungsionalitas dasar. Banyak library AI cutting-edge dan tools optimisasi dikembangkan di lingkungan akademik dan startup, tetapi ini biasanya memprioritaskan dukungan NVIDIA terlebih dahulu. Ini menciptakan siklus di mana AMD harus terus-menerus mengejar ketertinggalan, mengimplementasikan dukungan untuk inovasi yang sudah mapan di ekosistem CUDA.

Kesuksesan Datacenter vs Pengabaian Konsumen

Menariknya, AMD tampaknya berkinerja jauh lebih baik dalam deployment datacenter skala besar di mana mereka dapat memberikan dukungan engineering langsung. Beberapa instalasi supercomputing besar berhasil menggunakan akselerator AMD Instinct, menunjukkan bahwa perangkat keras dan perangkat lunak dapat bekerja secara efektif ketika sumber daya yang cukup didedikasikan untuk implementasi dan optimisasi.

Top500 adalah perbandingan yang tidak relevan; tentu saja AMD akan memberikan dukungan langsung kepada institusi tunggal yang memberi mereka ratusan juta dolar dan membantu membuat produk mereka bekerja dengan baik.

Disparitas ini menyoroti pertanyaan strategis fundamental untuk AMD. Sementara fokus pada pelanggan datacenter bernilai tinggi mungkin tampak masuk akal secara finansial dalam jangka pendek, ini berpotensi merusak pengembangan ekosistem jangka panjang yang membutuhkan adopsi berbasis luas di berbagai segmen pengguna.

Kehadiran AMD di Superkomputer Top500:

  • 4 dari 10 sistem teratas berjalan dengan kartu AMD Instinct (Juni 2025)
  • Sistem El Capitan: biaya ~$700 juta USD, 50.000+ GPU MI300
  • AMD menunjukkan performa kuat dalam deployment HPC skala besar
  • Kontras dengan dominasi pasar NVIDIA yang lebih luas pada sistem yang lebih kecil

Jalan ke Depan

Pengumuman terbaru AMD tentang dukungan ROCm hari pertama untuk GPU konsumen baru menunjukkan perusahaan mungkin mengenali tantangan ekosistem ini. Namun, mengingat sejarah AMD dengan masalah dukungan perangkat lunak, banyak di komunitas tetap skeptis tentang apakah janji-janji ini akan dipenuhi secara efektif.

Kesuksesan perusahaan di area lain, khususnya dengan CPU Ryzen dan prosesor EPYC, menunjukkan mereka dapat mengeksekusi dengan baik pada tantangan teknis yang kompleks. Pertanyaannya tetap apakah AMD dapat menerapkan tingkat fokus dan investasi yang sama pada stack perangkat lunak GPU mereka sebelum keunggulan NVIDIA menjadi tidak dapat diatasi.

Untuk saat ini, developer dan peneliti terus menghadapi pilihan sulit antara performa perangkat keras AMD yang berpotensi superior dan ekosistem perangkat lunak NVIDIA yang lebih matang dan andal. Sampai AMD dapat secara konsisten memberikan kualitas perangkat lunak di seluruh jajaran produk mereka, mereka mungkin akan kesulitan mendapatkan pangsa pasar yang signifikan di sektor AI yang berkembang pesat.

Referensi: AMD's AI Future Is Back Scale Yellow