Dalam langkah yang berpotensi mengubah lanskap persaingan kecerdasan buatan, perusahaan AI asal Tiongkok, DeepSeek, secara resmi meluncurkan seri model V3.2-nya. Peluncuran ini menandai eskalasi signifikan dalam pertarungan berkelanjutan antara AI open-source dan proprietary, dengan menawarkan kemampuan penalaran dan agen tingkat lanjut pada titik harga yang jauh lebih murah dibandingkan pemimpin industri. Peluncuran ini menyusul versi eksperimental yang diumumkan pada Oktober lalu dan terjadi saat komunitas AI semakin mempertanyakan apakah kesenjangan kinerja antara model yang tersedia gratis dan model closed-source benar-benar tak teratasi.
Peluncuran Resmi dan Varian Model
DeepSeek telah merilis dua versi berbeda dari model V3.2-nya: DeepSeek-V3.2 standar dan DeepSeek-V3.2-Speciale yang lebih kuat. Versi standar kini tersedia di semua saluran resmi, termasuk antarmuka web perusahaan, aplikasi seluler, dan layanan API. Ini merupakan model DeepSeek pertama yang mengintegrasikan "proses berpikir" langsung ke dalam kemampuan penggunaan alatnya, mendukung mode berpikir dan non-berpikir untuk panggilan alat. Namun, varian Speciale saat ini hanya ditawarkan sebagai layanan API sementara, yang secara eksplisit diposisikan untuk evaluasi komunitas dan tujuan penelitian. Strategi peluncuran bertahap ini memungkinkan DeepSeek mengumpulkan umpan balik dunia nyata pada model paling canggihnya sambil membuat teknologi inti segera dapat diakses oleh pengembang.
Varian Model & Ketersediaan
- DeepSeek-V3.2 (Standar): Umumnya tersedia di situs web resmi, Aplikasi, dan API.
- DeepSeek-V3.2-Speciale: Hanya tersedia sebagai API sementara untuk evaluasi/penelitian komunitas.
Klaim Kinerja vs. Model Proprietary
- Lebih unggul dalam beberapa tolok ukur: OpenAI GPT-5 High, Anthropic Claude 4.5 Sonnet, Google Gemini 3.0 Pro.
- Prestasi Akademik: Kinerja tingkat emas dalam Olimpiade Matematika Internasional (IMO) dan Olimpiade Informatika Internasional.
Perbandingan Harga (per 1 juta token)
| Model | Biaya API |
|---|---|
| DeepSeek V3.2 Speciale | USD 0.028 |
| Google Gemini 3 | Hingga USD 4.00 |
Inovasi Teknis
- Masalah Inti yang Diidentifikasi: Model open-source mengandalkan "vanilla attention" yang lambat dan boros komputasi.
- Solusi: DeepSeek Sparse Attention (DSA) menggunakan "lightning indexer" dua fase untuk menemukan token yang relevan sebelum menerapkan komputasi penuh, yang secara drastis meningkatkan efisiensi.
- Pelatihan: Menggunakan model "tutor" spesialis untuk pelatihan pasca-pelatihan di seluruh tugas menulis, matematika, pemrograman, dan tugas agen.
Keterbatasan yang Diakui "Pengetahuan dunia" yang lebih terbatas dibandingkan dengan model proprietary terdepan. Membutuhkan lebih banyak token untuk menyamai kualitas keluaran.
- Kesulitan dengan tugas yang lebih kompleks.
Kinerja yang Menyaingi Model Terdepan
Klaim kinerja seputar V3.2, khususnya edisi Speciale, sangat berani. Menurut data yang diterbitkan oleh DeepSeek, model ini bersaing langsung dengan generasi sistem proprietary tingkat atas saat ini. Perusahaan menyatakan bahwa V3.2 Speciale mengungguli model seperti GPT-5 High dari OpenAI, Claude 4.5 Sonnet dari Anthropic, dan Gemini 3.0 Pro dari Google pada tolok ukur penalaran tertentu. Model ini juga telah mencapai kinerja tingkat emas dalam kompetisi akademik bergengsi, termasuk Olimpiade Matematika Internasional (IMO) dan Olimpiade Informatika Internasional. Pencapaian ini membangun reputasi yang telah didirikan DeepSeek awal tahun ini dengan model R1-nya, sebuah AI penalaran open-source yang melampaui o1 dari OpenAI pada beberapa tolok ukur kunci. Pola konsisten dari kinerja kompetitif ini menantang narasi bahwa model proprietary memegang keunggulan kemampuan yang tak tertandingi.
Keunggulan Biaya yang Sangat Signifikan
Mungkin aspek yang paling mengganggu dari peluncuran V3.2 adalah harganya. DeepSeek telah mempertahankan strateginya untuk secara drastis mengurangi biaya dengan setiap iterasi model. Mengakses model V3.2 Speciale melalui API hanya berbiaya 0,028 dolar AS per 1 juta token. Sebagai perbandingan, menggunakan Gemini 3 dari Google via API dapat menghabiskan biaya hingga 4,00 dolar AS untuk volume yang sama. Ini mewakili perbedaan biaya lebih dari 140 kali lipat. Dalam sebuah makalah penelitian, DeepSeek memposisikan V3.2 sebagai "alternatif yang sangat hemat biaya dalam skenario agen," dengan berargumen bahwa model ini "secara signifikan mempersempit kesenjangan kinerja antara model open-source dan proprietary terdepan sambil menanggung biaya yang jauh lebih rendah." Penetapan harga agresif ini secara langsung mengancam rasional ekonomi di balik investasi besar-besaran yang dilakukan oleh lab AI proprietary, berpotensi merusak proposisi nilai fundamental mereka bagi pengembang dan perusahaan.
Inovasi Teknis: Bekerja Lebih Cerdas, Bukan Lebih Keras
Pendekatan teknis DeepSeek untuk menjembatani kesenjangan kinerja berfokus pada mendiagnosis kelemahan spesifik dalam arsitektur open-source. Perusahaan mengidentifikasi tiga masalah inti: ketergantungan pada mekanisme "perhatian biasa" yang tidak efisien, fase pasca-pelatihan yang terbatas secara komputasi, dan kesulitan dengan generalisasi tugas serta pengikutan instruksi panjang. Sebagai tanggapan, mereka mengembangkan DeepSeek Sparse Attention (DSA). Mekanisme baru ini beroperasi dalam dua fase untuk mengurangi kompleksitas komputasi. Pertama, sebuah "pencari kilat" melakukan pemindaian tingkat tinggi untuk mengidentifikasi token paling relevan dari data pelatihannya untuk kueri tertentu. Kemudian, ia menerapkan daya komputasi penuhnya hanya pada subset yang telah disaring ini. Perusahaan mengibaratkan ini seperti berpindah dari mencari sebuah kalimat dalam tumpukan buku raksasa yang berserakan menjadi menemukannya di perpustakaan yang tertata rapi—proses yang jauh lebih efisien. Untuk mengatasi keterbatasan pasca-pelatihan, DeepSeek membangun serangkaian model "spesialis" untuk membimbing dan menyempurnakan kemampuan V3.2 di berbagai domain seperti penulisan, matematika, pemrograman, dan tugas-tugas agen.
Keterbatasan yang Diakui dan Jalan ke Depan
Terlepas dari pencapaiannya, DeepSeek transparan tentang kekurangan V3.2 saat ini. "Pengetahuan dunia" model—pemahaman praktis yang disimpulkan dari data pelatihan—dicatat lebih terbatas dibandingkan dengan model proprietary terkemuka. Model ini juga membutuhkan lebih banyak token untuk menghasilkan keluaran dengan kualitas yang setara dan kesulitan dengan tugas yang sangat kompleks. Perusahaan mengakui kesenjangan ini dan menguraikan jalan ke depan yang berfokus pada meningkatkan daya komputasi selama pra-pelatihan dan menyempurnakan "resep pasca-pelatihan"-nya. Keterbatasan ini menyoroti bahwa perlombaan belum berakhir, tetapi juga membingkai kesenjangan kinerja sebagai tantangan teknis yang harus diselesaikan, bukan fitur permanen dari lanskap AI. Tindakan mengidentifikasi dan secara terbuka mengatasi kelemahan ini adalah bagian dari filosofi pengembangan iteratif model open-source.
Implikasi untuk Masa Depan Industri AI
Peluncuran DeepSeek V3.2 membawa implikasi mendalam yang melampaui sekadar peluncuran produk tunggal. Ini memberikan bukti yang semakin berkembang bahwa pembagian antara AI open-source dan closed-source bukanlah hukum yang tetap, tetapi perbedaan yang dapat dijembatani melalui inovasi di area seperti mekanisme perhatian dan metodologi pelatihan. Yang lebih penting, dengan menawarkan model dengan kemampuan penalaran kompetitif pada biaya hampir nol bagi pengembang untuk mengakses dan membangun di atasnya, DeepSeek menantang model bisnis inti dari AI proprietary. Jika tren ini berlanjut dan model open-source mulai mengungguli model proprietary di area kunci, justifikasi untuk membayar harga premium untuk alat closed-source berkurang secara signifikan. Peluncuran ini memanaskan perlombaan, memaksa seluruh industri untuk mempertimbangkan kembali keseimbangan antara keterbukaan, kinerja, dan biaya di era kecerdasan buatan berikutnya.
