NVIDIA secara diam-diam telah merilis keluarga model AI reasoning baru yang disebut OpenReasoning-Nemotron , menandai perubahan signifikan dalam pendekatan perusahaan terhadap pengembangan AI open-source. Meskipun pengumuman awal berfokus pada keluarga Llama Nemotron , rilis sebenarnya mengungkapkan fondasi teknis yang berbeda dan telah menarik perhatian komunitas AI.
Model yang Dibangun di Atas Arsitektur DeepSeek R1
Aspek paling mencolok dari rilis ini adalah bahwa model OpenReasoning-Nemotron milik NVIDIA sebenarnya didistilasi dari model R1 0528 milik DeepSeek yang memiliki 671 miliar parameter, bukan dibangun di atas arsitektur Llama milik Meta seperti yang awalnya disarankan. Ini merupakan penyimpangan yang mencolok dari kolaborasi sebelumnya NVIDIA dan menyoroti pengaruh yang semakin besar dari kemampuan reasoning DeepSeek dalam lanskap AI.
Keluarga model ini mencakup empat varian dengan parameter 1,5 miliar, 7 miliar, 14 miliar, dan 32 miliar, masing-masing dirancang untuk melayani persyaratan komputasi dan skenario deployment yang berbeda. Rentang ini memungkinkan pengembang untuk memilih ukuran model yang sesuai berdasarkan batasan perangkat keras spesifik mereka dan kebutuhan performa.
DeepSeek R1: Model bahasa besar yang dikembangkan oleh perusahaan AI China DeepSeek , dikenal karena kemampuan reasoning yang kuat dan jumlah parameter yang masif.
Varian Model OpenReasoning-Nemotron:
- 1.5B parameter - Dioptimalkan untuk perangkat edge dan PC
- 7B parameter - Performa seimbang untuk deployment GPU tunggal
- 14B parameter - Penalaran yang ditingkatkan untuk server kelas menengah
- 32B parameter - Akurasi maksimal untuk sistem enterprise multi-GPU
Respons Komunitas dan Detail Teknis
Komunitas pengembangan AI telah menunjukkan reaksi beragam terhadap waktu rilis dan spesifikasi teknis. Beberapa pengembang telah mencatat kebingungan antara pengumuman awal bulan Maret dan rilis saat ini, menunjukkan bahwa komunikasi NVIDIA seputar peluncuran produk ini kurang jelas.
Akses ke model-model tersebut memerlukan autentikasi melalui platform build NVIDIA , yang telah menciptakan beberapa hambatan bagi pengembang yang ingin bereksperimen dengan kemampuan reasoning baru. Model-model tersebut tersedia melalui saluran resmi NVIDIA dan Hugging Face , menyediakan berbagai jalur untuk integrasi ke dalam alur kerja AI yang ada.
Fondasi Teknis:
- Didistilasi dari DeepSeek R1 0528 (671B parameter)
- Tersedia melalui NVIDIA build.nvidia.com dan Hugging Face
- Memerlukan autentikasi untuk akses model
- Bagian dari platform perangkat lunak NVIDIA AI Enterprise
Klaim Performa dan Aplikasi Dunia Nyata
NVIDIA mengklaim model-model baru tersebut memberikan akurasi hingga 20% lebih baik dibandingkan model dasar dan mencapai kecepatan inferensi 5 kali lebih cepat daripada model reasoning terbuka yang bersaing. Peningkatan performa ini dapat berdampak signifikan pada adopsi enterprise, terutama dalam skenario yang memerlukan pengambilan keputusan kompleks dan tugas reasoning multi-langkah.
Perusahaan telah memposisikan model-model ini sebagai alat dasar untuk membangun sistem AI agentic - agen AI otonom yang dapat bekerja secara independen atau dalam tim untuk memecahkan masalah kompleks. Ini sejalan dengan tren industri yang lebih luas menuju aplikasi AI yang lebih canggih yang dapat menangani tantangan bisnis dunia nyata dengan intervensi manusia yang minimal.
Rilis OpenReasoning-Nemotron mewakili dorongan berkelanjutan NVIDIA ke dalam lanskap kompetitif model AI reasoning. Meskipun fondasi teknis mungkin berbeda dari pengumuman awal, fokus pada aplikasi enterprise praktis dan metrik performa yang ditingkatkan menunjukkan bahwa model-model ini dapat memainkan peran penting dalam fase selanjutnya deployment AI di berbagai industri.