Nvidia Ubah Strategi, Luncurkan Nemotron 3 sebagai Lindungan dalam Perlombaan Model Terbuka

Tim Editorial BigGo
Nvidia Ubah Strategi, Luncurkan Nemotron 3 sebagai Lindungan dalam Perlombaan Model Terbuka

Nvidia, yang telah lama menjadi kekuatan dominan dalam menyediakan tenaga komputasi untuk kecerdasan buatan, sedang melakukan pergeseran strategi yang berani. Pada 15 Desember 2025, perusahaan mengumumkan seri model AI sumber terbuka Nemotron 3, menandakan langkah yang lebih dalam ke arena perangkat lunak dan pembuatan model. Peluncuran ini datang pada momen kritis, ketika laboratorium AI besar mengembangkan chip silikon khusus mereka sendiri, yang berpotensi mengancam bisnis perangkat keras inti Nvidia. Dengan merilis model yang kuat dan transparan, Nvidia bertujuan untuk memperkuat perannya sebagai platform yang sangat diperlukan untuk pengembangan AI, terlepas dari chip siapa yang akhirnya menjalankan kode tersebut.

Pergeseran Strategi Nvidia dari Perangkat Keras ke Platform Terbuka

Selama bertahun-tahun, kesuksesan Nvidia dibangun di atas GPU-nya, yang menjadi standar de facto untuk melatih dan menjalankan model bahasa besar. Namun, lanskap persaingan sedang berubah. Perusahaan seperti OpenAI, Google, dan Anthropic semakin banyak berinvestasi dalam chip AI proprietary, tren yang pada akhirnya dapat mengurangi ketergantungan mereka pada perangkat keras Nvidia. Peluncuran seri Nemotron 3 ini secara luas dilihat sebagai lindungan strategis terhadap kemungkinan masa depan ini. Dengan menyediakan model terbuka yang mutakhir, Nvidia memastikan ekosistemnya tetap menjadi pusat inovasi AI. CEO Jensen Huang membingkai langkah ini sebagai komitmen terhadap "inovasi terbuka," menyatakan tujuannya adalah mengubah AI canggih menjadi platform terbuka yang menawarkan transparansi dan efisiensi yang dibutuhkan pengembang untuk membangun "sistem agen" yang kompleks dalam skala besar.

Memperkenalkan Keluarga Model Nemotron 3: Spesifikasi dan Arsitektur

Keluarga Nemotron 3 terdiri dari tiga model berbeda, masing-masing menargetkan kasus penggunaan dan anggaran komputasi yang berbeda. Seri ini dibangun di atas arsitektur hybrid latent mixture-of-experts (MoE) yang baru, yang menurut Nvidia sangat efektif untuk menciptakan agen AI yang mampu mengambil tindakan. Arsitektur ini memungkinkan bagian-bagian berbeda dari model, atau "ahli," diaktifkan untuk tugas-tugas spesifik, yang mengarah pada efisiensi yang lebih besar. Model terkecil, Nemotron 3 Nano, adalah model 30 miliar parameter yang dirancang untuk tugas-tugas yang ditargetkan dan sensitif terhadap biaya seperti debugging kode dan ringkasan. Nemotron 3 Super tingkat menengah adalah model sekitar 100 miliar parameter yang dioptimalkan untuk penalaran dalam aplikasi multi-agen. Di ujung atas, Nemotron 3 Ultra adalah model raksasa dengan sekitar 500 miliar parameter, dimaksudkan untuk aplikasi AI paling kompleks yang membutuhkan penalaran mendalam.

Spesifikasi Model Nemotron 3

Nama Model Parameter (Total) Parameter Aktif/Token Kasus Penggunaan Sasaran Ketersediaan
Nemotron 3 Nano 30 Miliar Hingga 3 Miliar Tugas hemat biaya (debugging, summarization) Tersedia Sekarang (Hugging Face)
Nemotron 3 Super ~100 Miliar Hingga 10 Miliar Penalaran untuk aplikasi multi-agen H1 2026
Nemotron 3 Ultra ~500 Miliar Hingga 50 Miliar Aplikasi AI kompleks H1 2026
Semua model menampilkan arsitektur Mixture-of-Experts (MoE) laten hibrida dan jendela konteks 1M token.

Klaim Kinerja dan Posisi Kompetitif

Nvidia telah memposisikan seri Nemotron 3 sebagai "keluarga model terbuka paling efisien" untuk membangun aplikasi agen AI. Untuk model Nano, perusahaan mengklaim lompatan kinerja signifikan dibandingkan pendahulunya, termasuk peningkatan throughput pemrosesan token hingga 4x dan pengurangan latensi pembuatan token sebesar 60%, yang secara langsung diterjemahkan menjadi biaya inferensi yang lebih rendah. Lebih lanjut, dengan jendela konteks 1 juta token, model Nano dapat mempertahankan koherensi dalam percakapan dan dokumen yang jauh lebih panjang. Dengan merilis tidak hanya model tetapi juga data pelatihan dan alat fine-tuning, Nvidia mengadopsi pendekatan yang lebih transparan daripada banyak pesaing AS-nya, sebuah langkah yang dirancang untuk menarik pengembang yang perlu menyesuaikan model secara mendalam untuk alur kerja perusahaan tertentu.

Peningkatan Kinerja yang Dilaporkan (Nemotron 3 Nano vs. Pendahulunya)

  • Throughput: Hingga 4x lebih tinggi dalam pemrosesan token.
  • Latensi: Pengurangan 60% dalam latensi pembuatan token inferensi.
  • Konteks: Jendela konteks 1-juta-token untuk menangani tugas panjang dan multi-langkah.

Lanskap Model Terbuka dan Tantangan Geopolitik

Peluncuran ini memasuki ekosistem model terbuka yang sangat kompetitif. Sementara perusahaan AS baru-baru ini menjadi lebih tertutup, perusahaan China seperti DeepSeek, Alibaba, dan Moonshot AI secara agresif telah merilis model terbuka yang kuat dan mempublikasikan penelitian terperinci. Data dari platform seperti Hugging Face dan OpenRouter menunjukkan model China ini sangat populer, sebagian karena pembaruan dan transparansi yang sering. Ini menghadirkan tantangan unik bagi Nvidia. Perangkat kerasnya sudah menjadi titik fokus dalam ketegangan perdagangan AS-China, dengan pembatasan ekspor pada chip paling canggihnya. Saat China mendorong swasembada teknologi, model AI-nya mungkin semakin dioptimalkan untuk silikon domestik, yang berpotensi mengikis posisi pasar Nvidia. Dengan menawarkan rangkaian model terbuka kelas dunia, Nvidia berusaha mempertahankan relevansi dan pengaruhnya di semua lini pengembangan AI, terlepas dari kendala perangkat keras geopolitik.

Adopsi Awal dan Peta Jalan Masa Depan

Nvidia telah mengamankan daftar pengadopsi perusahaan awal yang patut diperhatikan untuk teknologi Nemotron, termasuk Cisco, Siemens, ServiceNow, dan Accenture. Perusahaan-perusahaan ini mengintegrasikan model ke dalam alur kerja untuk industri mulai dari manufaktur dan keamanan siber hingga pengembangan perangkat lunak. Model Nemotron 3 Nano tersedia segera di Hugging Face, memberikan akses instan bagi startup dan peneliti. Model Super dan Ultra yang lebih besar dijadwalkan untuk dirilis pada paruh pertama tahun 2026. Peluncuran bertahap ini memungkinkan komunitas pengembang mulai membangun dengan model Nano yang efisien sementara Nvidia mempersiapkan rekan-rekan yang lebih banyak sumber dayanya. Kesuksesan perusahaan dalam usaha baru ini akan bergantung pada apakah komunitas pengembang menerima Nemotron sebagai alat dasar untuk gelombang berikutnya dari AI agen, memperkuat platform Nvidia melampaui akar silikonnya.