Perusahaan riset AI China DeepSeek secara resmi telah mengungkap model open-source terbarunya, DeepSeek-V3.1 , menandai kemajuan signifikan dalam kemampuan kecerdasan buatan sambil secara bersamaan mengumumkan kenaikan harga substansial untuk layanan API-nya. Peluncuran ini merepresentasikan lebih dari sekadar peningkatan parameter dari 671 miliar menjadi 685 miliar parameter—ini memperkenalkan arsitektur penalaran hibrida yang revolusioner yang dapat mengubah cara sistem AI berinteraksi dengan pengguna dan menangani tugas-tugas kompleks.
Arsitektur Penalaran Hibrida yang Revolusioner
DeepSeek-V3.1 memperkenalkan arsitektur penalaran hibrida pertama di industri yang memungkinkan satu model untuk beralih secara mulus antara mode berpikir ( deepseek-reasoner ) dan mode non-berpikir ( deepseek-chat ). Pengguna dapat beralih antara mode-mode ini melalui aplikasi resmi atau antarmuka web menggunakan tombol deep thinking. Mode non-berpikir menargetkan pertanyaan sederhana seperti cuaca atau pertanyaan ensiklopedia, memberikan hasil yang efisien dengan waktu respons 20% lebih cepat. Sementara itu, mode berpikir menangani masalah kompleks seperti pembuktian matematika dan debugging kode dengan mengaktifkan rantai penalaran dalam yang mendalam, menghasilkan logika yang lebih ketat dengan biaya respons yang sedikit lebih lambat.
Peningkatan Efisiensi Melalui Kompresi Chain-of-Thought
Model baru ini menunjukkan peningkatan efisiensi yang luar biasa melalui pelatihan kompresi chain-of-thought yang canggih. DeepSeek-V3.1 mempertahankan tingkat kinerja yang sebanding dengan pendahulunya R1-0528 sambil mengurangi generasi token output sebesar 20-50%. Tugas-tugas yang sebelumnya memerlukan 1000 token kini dapat diselesaikan dengan hanya 500 token sambil mempertahankan kualitas output yang setara. Peningkatan efisiensi ini diterjemahkan menjadi biaya komputasi yang secara signifikan lebih rendah dan latensi respons yang berkurang, membuat teknologi ini lebih mudah diakses untuk penerapan yang luas.
Tolok Ukur Performa
Tes | Skor DeepSeek-V3.1 | Skor Model Sebelumnya |
---|---|---|
AIME 2015 Mathematics | 87.5/100 | 88.4/100 |
GPQA Science | 81/100 | 80.1/100 |
liveCodeBench | 73.3/100 | 74.8/100 |
Pengurangan Token | 20-50% lebih sedikit | Baseline |
Spesifikasi Teknis dan Benchmark Kinerja
Dibangun pada arsitektur Mixture-of-Experts (MoE), DeepSeek-V3.1 dengan 685 miliar parameter hanya mengaktifkan 37 miliar parameter per token, mencapai keseimbangan optimal antara efisiensi dan kinerja. Model ini mendukung berbagai format tensor termasuk BF16, FP8 (F8_E4M3), dan F32, memberikan fleksibilitas optimisasi perangkat keras kepada pengembang. Model dasar menjalani pelatihan tambahan dengan 840 miliar token di luar fondasi V3, memperluas kemampuan pemrosesan konteks panjangnya hingga 128K token—setara dengan sekitar 130.000 karakter China atau 80 bab pertama Dream of the Red Chamber.
Perbandingan Spesifikasi Model
Fitur | DeepSeek-V3 | DeepSeek-V3.1 |
---|---|---|
Total Parameter | 671 miliar | 685 miliar |
Parameter Aktif per Token | 37 miliar | 37 miliar |
Jendela Konteks | 128K token | 128K token |
Pelatihan Tambahan | - | 840B token |
Standar Presisi | Standard FP8 | UE8M0 FP8 |
Arsitektur | MoE | Hybrid MoE |
Adopsi Strategis Standar UE8M0 FP8
Mungkin yang paling signifikan untuk lanskap AI global, DeepSeek-V3.1 mengadopsi standar presisi UE8M0 FP8 yang secara khusus dirancang untuk chip domestik China generasi berikutnya. Keputusan teknis ini merepresentasikan pergeseran strategis dari standar FP8 E4M3/E5M2 NVIDIA , berpotensi menciptakan dua jalur ekosistem AI yang berbeda. Format UE8M0 memprioritaskan konsumsi daya yang lebih rendah dan komputasi yang lebih cepat daripada presisi yang lebih tinggi yang ditawarkan oleh standar NVIDIA , membuatnya lebih cocok untuk arsitektur chip domestik dengan filosofi desain yang berbeda.
Penyesuaian Harga API yang Substansial
Bersamaan dengan pengumuman teknis, DeepSeek mengungkapkan perubahan harga yang signifikan yang berlaku efektif 6 September. Harga input untuk cache miss akan meningkat dari yuan China ¥2 menjadi ¥4 per juta token, sementara harga output naik dari ¥8 menjadi ¥12 per juta token. Perusahaan juga menghilangkan diskon harga malam hari. Penyesuaian ini mencerminkan investasi penelitian dan pengembangan yang substansial yang diperlukan untuk peningkatan V3.1, termasuk pelatihan 840 miliar token tambahan dan adaptasi presisi UE8M0 FP8 untuk kompatibilitas chip domestik.
Perubahan Harga API (Berlaku 6 September 2025)
Jenis Layanan | Harga Sebelumnya | Harga Baru | Perubahan |
---|---|---|---|
Input (cache miss) | ¥2/juta token | ¥4/juta token | +100% |
Input (cache hit) | ¥0,5/juta token | ¥0,5/juta token | Tidak ada perubahan |
Output | ¥8/juta token | ¥12/juta token | +50% |
Diskon Malam Hari | Tersedia | Dihapus | Dihilangkan |
Dampak Pasar dan Implikasi Industri
Peluncuran ini telah menghasilkan respons pasar yang signifikan, dengan saham-saham terkait AI mengalami kenaikan yang mencolok. Perusahaan seperti Cambricon , yang memproduksi chip AI yang kompatibel dengan teknologi DeepSeek , mengalami kenaikan intraday hampir 14%. Lisensi MIT open-source model dan optimisasi API diharapkan dapat mempercepat penerapan agen AI di sektor keuangan, medis, dan otomasi kantor. Analis industri memprediksi pasar agen AI dapat mencapai yuan China ¥852 miliar pada 2028, dengan tingkat pertumbuhan tahunan majemuk 72,7%.
Dampak Pasar Saham (Hari Pengumuman)
- Cambricon (688256.SH): Keuntungan intraday +14%
- Kunlun Wanwei (300418.SZ): Keuntungan +10%
- Hanvon Ugee (300170.SZ): Perdagangan aktif dalam konsep agen AI
- iFlytek (002230.SZ): Performa +35% year-to-date
- Wondershare (300624.SZ): Keuntungan tahunan +80%, pertumbuhan laba +42%
Masa Depan Kompetisi Ekosistem AI
Pilihan strategis DeepSeek dengan V3.1 menandakan pergeseran yang lebih luas dalam lanskap AI global. Dengan mengadopsi standar teknis domestik dan menunjukkan bahwa kemampuan AI canggih tidak memerlukan sumber daya komputasi yang masif, perusahaan ini memposisikan dirinya sebagai pemimpin dalam jalur pengembangan kinerja tinggi yang ringan. Pendekatan ini memberikan peluang bagi pengembang kecil di seluruh dunia untuk berpartisipasi dalam inovasi AI sambil berpotensi menciptakan ekosistem AI paralel berdasarkan fondasi teknis yang berbeda dan pertimbangan geopolitik.