DeepSeek Meluncurkan Model AI V3.2-Exp dengan Dukungan Hari Pertama untuk Chip China, Menantang Dominasi CUDA Nvidia

Tim Editorial BigGo
DeepSeek Meluncurkan Model AI V3.2-Exp dengan Dukungan Hari Pertama untuk Chip China, Menantang Dominasi CUDA Nvidia

Perusahaan kecerdasan buatan China DeepSeek telah melakukan pivot strategis dengan peluncuran model terbarunya, menandakan pergeseran fundamental dalam cara perusahaan AI besar mendekati kompatibilitas perangkat keras. Peluncuran DeepSeek-V3.2-Exp mewakili lebih dari sekadar pembaruan model bahasa biasa—ini menandai pertama kalinya perusahaan AI China terkemuka memprioritaskan arsitektur chip domestik sejak hari pertama, alih-alih memperlakukannya sebagai hal yang tidak penting.

Pergeseran Strategis Menuju Kemandirian Perangkat Keras Domestik

DeepSeek mengumumkan model V3.2-Exp pada 29 September 2024, dengan optimasi langsung untuk perangkat keras Ascend milik Huawei dan software stack CANN. Ini merupakan penyimpangan dari pendekatan tradisional di mana model pertama kali dioptimalkan untuk ekosistem CUDA Nvidia sebelum diadaptasi untuk platform alternatif. Perusahaan memposisikan rilis ini sebagai langkah perantara menuju arsitektur generasi berikutnya kami, yang dirancang khusus untuk mengurangi biaya yang terkait dengan inferensi konteks panjang melalui mekanisme sparse attention yang inovatif.

Fitur Teknis Utama

  • Mekanisme Sparse Attention: Mengurangi kebutuhan memori dan komputasi untuk inferensi konteks panjang
  • Deployment Lintas Platform: Artefak model yang sama dapat bekerja di berbagai jenis akselerator dengan perubahan minimal
  • Dukungan TileLang: Direkomendasikan untuk prototyping dan pengembangan
  • Paritas vLLM: Kompatibilitas fitur dengan framework inferensi yang telah mapan saat peluncuran

Respons Industri Terkoordinasi Menunjukkan Kematangan Ekosistem

Kecepatan adopsi di seluruh lanskap semikonduktor China sangat luar biasa. Tim Ascend Huawei berkolaborasi erat dengan komunitas vLLM-Ascend untuk memastikan kompatibilitas langsung, menerbitkan panduan instalasi operator khusus dan paket kernel khusus untuk NPU Ascend. Tingkat koordinasi ini menunjukkan ekosistem yang semakin matang yang dapat merespons dengan cepat arsitektur model baru tanpa menunggu implementasi CUDA upstream.

Beberapa Pembuat Chip Bergabung dalam Inisiatif

Selain Huawei, perusahaan semikonduktor besar China lainnya dengan cepat menyelaraskan platform mereka dengan model baru. Cambricon merilis pembaruan untuk fork vLLM-MLU-nya, mengklaim bahwa kombinasi mesin inferensinya dengan arsitektur sparse attention V3.2-Exp secara signifikan mengurangi biaya pemrosesan untuk urutan panjang. Sementara itu, Hygon mengumumkan bahwa akselerator DCU-nya telah dioptimalkan untuk deployment tanpa tunggu melalui software stack DTK-nya, menunjukkan luasnya partisipasi industri.

Platform Perangkat Keras yang Didukung

Perusahaan Perangkat Keras Software Stack Status
Huawei Ascend NPUs CANN Dukungan hari pertama dengan operator khusus
Cambricon Akselerator MLU vLLM-MLU Fork yang diperbarui dengan optimisasi inferensi
Hygon Akselerator DCU DTK Kemampuan deployment tanpa menunggu
Nvidia GPU CUDA Kompatibilitas yang terjaga

Inovasi Teknis Mendorong Pengurangan Biaya

Model V3.2-Exp menggabungkan mekanisme sparse attention canggih yang memangkas persyaratan memori dan komputasi sambil mempertahankan kualitas output. Pendekatan teknis ini mengatasi salah satu tantangan paling signifikan dalam deployment model bahasa besar—peningkatan biaya eksponensial yang terkait dengan pemrosesan jendela konteks yang lebih panjang. Dokumentasi GitHub DeepSeek menunjukkan kesetaraan fitur dengan framework yang sudah mapan seperti vLLM saat peluncuran, menunjukkan rekayasa yang kuat di balik deployment yang cepat.

Kompatibilitas Lintas Platform Mempertahankan Fleksibilitas

Meskipun fokus pada perangkat keras China, DeepSeek telah mempertahankan kompatibilitas dengan ekosistem Nvidia. Perusahaan mereferensikan kernel TileLang dan CUDA dalam dokumentasi teknisnya, mendorong peneliti untuk menggunakan TileLang untuk prototyping sambil memastikan artefak model yang sama dapat di-deploy di berbagai jenis akselerator dengan modifikasi minimal. Pendekatan ini memberikan fleksibilitas strategis sambil membangun kemampuan domestik.

Respons Pasar Mencerminkan Dorongan Kedaulatan AI yang Lebih Luas

Respons industri yang terkoordinasi telah berkontribusi pada sentimen pasar yang positif, dengan Indeks Hang Seng Tech Hong Kong mencapai tertinggi empat tahun setelah pengumuman tersebut. Komitmen pemerintah China sebesar yuan China 500 miliar (sekitar dolar Amerika Serikat 71 miliar) untuk inisiatif kecerdasan buatan, yang diumumkan oleh Komisi Pembangunan dan Reformasi Nasional, memberikan konteks tambahan untuk pentingnya strategis kemampuan AI domestik.

Konteks Dukungan Pemerintah

  • Inisiatif AI NDRC: Komitmen CNY 500 miliar (≈ USD 71 miliar) untuk kecerdasan buatan
  • Subsidi Konsumen: CNY 69 miliar didistribusikan kepada pemerintah daerah dari obligasi Treasury ultra-panjang
  • Total Year-to-Date: CNY 300 miliar dalam berbagai langkah dukungan

Implikasi untuk Kompetisi Perangkat Keras AI Global

Perkembangan ini merupakan indikasi paling jelas hingga saat ini bahwa ekosistem AI China secara aktif mempersiapkan skenario di mana akses ke perangkat keras Nvidia tidak dapat dijamin. Meskipun CUDA Nvidia tetap dominan secara global, pendekatan DeepSeek dalam memperlakukan akselerator domestik sebagai target kelas satu daripada opsi sekunder dapat mempengaruhi bagaimana perusahaan AI China lainnya mendekati strategi pengembangan dan deployment model di masa depan.