DeepSeek V3.1 Memperkenalkan Standar UE8M0 FP8, Memicu Reli Saham Chip AI China

Tim Editorial BigGo
DeepSeek V3.1 Memperkenalkan Standar UE8M0 FP8, Memicu Reli Saham Chip AI China

Perusahaan AI China DeepSeek telah memicu kegembiraan pasar yang signifikan dengan peluncuran model bahasa besar V3.1 yang memperkenalkan standar presisi UE8M0 FP8 revolusioner yang dirancang khusus untuk chip domestik generasi berikutnya. Pengumuman ini telah membuat saham semikonduktor China meroket, dengan perusahaan seperti Cambricon mengalami kenaikan dua digit karena investor mengantisipasi era baru kolaborasi perangkat lunak-perangkat keras dalam ekosistem AI China.

Perusahaan Chip AI China Utama yang Disebutkan

  • Cambricon (688256): Chip MLU370-X8 dengan dukungan kuantisasi FP8
  • Hygon Information (688041): Deep Computing Unit 2 (DCU) dengan performa 90% A100
  • Moore Threads: GPU MUSA 3.1 dengan dukungan FP8 native
  • VeriSilicon: NPU VIP9000 yang mendukung operasi FP8
  • Biren Technology: Chip BR104 dengan peningkatan throughput training 4x lipat

Arsitektur Penalaran Hibrida Revolusioner

DeepSeek V3.1 mewakili perubahan fundamental dalam desain model AI melalui Arsitektur Penalaran Hibrida yang inovatif. Terobosan ini memungkinkan pengguna untuk beralih dengan mulus antara mode berpikir dan non-berpikir dalam satu model, menghilangkan kebutuhan untuk beralih antara model khusus yang berbeda. Arsitektur ini mengintegrasikan kemampuan dialog umum, penalaran kompleks, dan fungsi pemrograman profesional ke dalam satu sistem terpadu, secara dramatis meningkatkan pengalaman pengguna dan efisiensi operasional.

Model ini menunjukkan peningkatan efisiensi yang luar biasa, dengan performa mode berpikir yang menyamai unggulan sebelumnya R1-0528 sambil mengurangi output token sebesar 20% hingga 50%. Teknologi kompresi rantai pemikiran ini memungkinkan model untuk menghasilkan jalur penalaran yang lebih ringkas tanpa mengorbankan akurasi, mengatasi tantangan lama dari biaya komputasi tinggi yang terkait dengan penalaran AI canggih.

UE8M0 FP8: Pengubah Permainan untuk Chip Domestik

Inovasi teknis yang telah menarik perhatian industri adalah implementasi presisi UE8M0 FP8 Scale oleh DeepSeek . Format floating-point 8-bit ini mewakili kemajuan signifikan dari sistem FP16 tradisional, menawarkan efisiensi komputasi dua kali lipat sambil mengurangi kebutuhan bandwidth memori sebesar 75%. Format UE8M0 mengalokasikan semua 8 bit untuk eksponen, menghilangkan bit mantissa dan tanda, yang memungkinkan prosesor untuk memulihkan data melalui pergeseran bit sederhana daripada operasi perkalian yang kompleks.

Standar presisi ini sangat menguntungkan untuk akselerator AI China yang sedang berkembang. Meskipun sebagian besar chip domestik saat ini beroperasi pada arsitektur FP16/INT8, prosesor generasi berikutnya dari perusahaan seperti Moore Threads (MUSA 3.1 GPU) dan VeriSilicon (VIP9000 NPU) menggabungkan dukungan FP8 asli. Penyelarasan antara optimisasi perangkat lunak DeepSeek dan kemampuan perangkat keras domestik menciptakan sinergi yang kuat yang dapat mengurangi ketergantungan pada sumber daya komputasi asing.

Spesifikasi Teknis UE8M0 FP8

  • Alokasi bit: Seluruh 8 bit didedikasikan untuk eksponen (tanpa bit mantissa/tanda)
  • Restorasi data: Pergeseran bit sederhana versus perkalian kompleks
  • Rentang dinamis: Kemampuan yang ditingkatkan untuk angka besar dan kecil
  • Kehilangan presisi: Degradasi informasi yang diminimalkan
  • Kompatibilitas perangkat keras: Dioptimalkan untuk chip AI China generasi berikutnya

Respons Pasar dan Dampak Industri

Pengumuman tersebut memicu reaksi pasar langsung, dengan saham konsep chip China mengalami kenaikan substansial. Daily Interactive melonjak 13,62% dalam perdagangan akhir, sementara perusahaan semikonduktor lainnya mengalami momentum naik yang serupa. Pengamat industri mencatat bahwa pernyataan tunggal DeepSeek tentang chip domestik generasi berikutnya mengandung informasi yang cukup untuk memicu spekulasi luas tentang lintasan kemerdekaan AI China.

Antusiasme pasar mencerminkan ekspektasi yang lebih luas bahwa kolaborasi perangkat lunak-perangkat keras ini dapat memecahkan paradigma tradisional bahwa performa lebih tinggi sama dengan biaya lebih tinggi dalam aplikasi AI. Layanan keuangan, kesehatan, dan skenario komputasi tinggi lainnya yang sebelumnya tidak layak secara biaya kini mungkin menjadi layak secara ekonomi, membuka peluang komersial baru di berbagai sektor.

Performa Teknis dan Aplikasi Dunia Nyata

Pengujian komunitas telah mengungkapkan metrik performa yang mengesankan untuk DeepSeek V3.1 . Dalam tes pemrograman multibahasa Aider , model ini melampaui skor Claude 4 Opus sambil mempertahankan biaya operasional yang lebih rendah. Kemampuan simulasi fisika yang ditingkatkan menunjukkan pemodelan dunia nyata yang lebih akurat, dengan penanganan parameter gravitasi, gesekan, rotasi, dan pantulan yang lebih baik.

Namun, beberapa pengguna melaporkan inkonsistensi dalam tugas terjemahan dan penulisan, mencatat output bahasa campuran dan kesalahan kata yang sesekali memerlukan rekayasa prompt manual untuk diselesaikan. Keterbatasan ini menunjukkan bahwa meskipun model unggul dalam aplikasi penalaran dan pemrograman, penyempurnaan dalam pemrosesan bahasa masih berlangsung.

Peningkatan Performa DeepSeek V3.1

Metrik Peningkatan
Pengurangan output token (mode thinking) 20-50%
Efisiensi komputasi vs FP16 Peningkatan 2x
Pengurangan bandwidth memori 75%
Peningkatan kepadatan komputasi Cambricon MLU370-X8 40%
Pengurangan konsumsi daya 50%

Implikasi Strategis untuk Ekosistem AI China

Peluncuran DeepSeek V3.1 menandakan titik transisi kritis untuk industri AI China, bergerak dari ketergantungan perangkat keras menuju solusi domestik terintegrasi. Standar UE8M0 FP8 mewakili lebih dari sekadar optimisasi teknis—ini menetapkan fondasi bagi perusahaan China untuk mengembangkan aplikasi AI tanpa bergantung berat pada arsitektur semikonduktor asing.

Para ahli industri menyarankan bahwa perkembangan ini dapat mempercepat timeline untuk penyebaran AI skala besar di China, terutama di sektor-sektor di mana sensitivitas biaya telah membatasi adopsi. Kombinasi efisiensi yang ditingkatkan dan kompatibilitas perangkat keras domestik memposisikan perusahaan AI China untuk bersaing lebih efektif di pasar global sambil mempertahankan kedaulatan teknologi.

Keberhasilan pendekatan integrasi perangkat lunak-perangkat keras ini dapat mempengaruhi perusahaan AI China lainnya untuk mengejar strategi serupa, berpotensi menciptakan dinamika kompetitif baru dalam lanskap kecerdasan buatan global. Saat DeepSeek melanjutkan pengembangan menuju model R2 yang diantisipasi, industri akan memantau dengan cermat apakah model kolaborasi domestik ini dapat mempertahankan momentum awalnya dan memenuhi janji komersialnya.