Model AI Kecil Samsung dengan 7 Juta Parameter Ungguli Raksasa Seperti Gemini dan o3-mini

Tim Editorial BigGo
Model AI Kecil Samsung dengan 7 Juta Parameter Ungguli Raksasa Seperti Gemini dan o3-mini

Dalam industri yang terobsesi dengan penskalaan model yang semakin besar, tim penelitian AI Samsung telah mengambil pendekatan yang sangat berbeda yang menantang asumsi dasar tentang kecerdasan buatan. Terobosan mereka, Tiny Recursive Model (TRM), dengan hanya tujuh juta parameter, mencapai kemampuan penalaran yang menyaingi atau melampaui model yang ribuan kali lebih besar, berpotensi membentuk ulang cara kita memikirkan efisiensi dan kinerja AI.

Tiny Recursive Model (TRM) yang revolusioner menampilkan pendekatan inovatif Samsung terhadap AI, menekankan efisiensi dan kemampuan penalaran yang canggih
Tiny Recursive Model (TRM) yang revolusioner menampilkan pendekatan inovatif Samsung terhadap AI, menekankan efisiensi dan kemampuan penalaran yang canggih

Revolusi Rekursif dalam Arsitektur AI

Inovasi inti di balik TRM Samsung terletak pada filosofi desain rekursifnya, yang secara fundamental membayangkan ulang bagaimana model AI memproses informasi. Alih-alih membangun jaringan yang lebih dalam dengan lebih banyak lapisan, para peneliti menciptakan sistem yang berulang kali menyempurnakan outputnya sendiri melalui beberapa tahap. Pendekatan ini meniru pemecahan masalah manusia di mana kita terus-menerus meningkatkan jawaban kita melalui refleksi dan revisi. Model ini menggunakan apa yang disebut para peneliti sebagai penyempurnaan rekursif dari keadaan laten dan output tanpa mengasumsikan konvergensi, yang berarti model tidak terburu-buru menentukan jawaban tetapi terus meningkatkannya melalui pemrosesan berulang.

Fitur Arsitektur Utama:

  • Model 2-layer tunggal dengan pemrosesan rekursif
  • Mekanisme penghentian adaptif untuk menentukan titik berhenti yang optimal
  • Supervisi mendalam dengan umpan balik di berbagai tahap pemrosesan
  • Penyempurnaan output melalui siklus penalaran iteratif

Kinerja Mengesankan Melawan Titan Industri

Model kecil Samsung telah menunjukkan kemampuan yang luar biasa di berbagai tugas penalaran yang menantang. Pada teka-teki Sudoku-Extreme, TRM mencapai akurasi 87,4%, secara signifikan mengungguli akurasi 55% dari Hierarchical Reasoning Models. Sistem ini juga menunjukkan akurasi 85% pada teka-teki Maze-Hard yang kompleks dan mencapai akurasi 45% pada tolok ukur ARC-AGI-1 yang menuntut, yang menguji kemampuan penalaran abstrak yang sering dikaitkan dengan kecerdasan buatan umum. Yang paling menonjol, hasil ini setara atau melampaui kinerja model raksasa seperti Google Gemini 2.5 Pro, OpenAI o3-mini, dan DeepSeek R1, meskipun hanya menggunakan sebagian kecil dari sumber daya komputasi mereka.

Tolok Ukur Kinerja TRM:

  • Sudoku-Extreme: akurasi 87,4%
  • Teka-teki Maze-Hard: akurasi 85%
  • ARC-AGI-1: akurasi 45%
  • ARC-AGI-2: akurasi 8%

Keunggulan Efisiensi dalam Aplikasi Praktis

Implikasi dari terobosan efisiensi ini melampaui sekadar rasa ingin tahu akademis. Menjalankan model dengan triliunan parameter memerlukan kluster besar chip khusus dan anggaran energi yang hanya dapat ditanggung oleh perusahaan teknologi terbesar. Sebaliknya, jejak tujuh juta parameter TRM dapat beroperasi pada perangkat keras standar dengan konsumsi energi yang jauh lebih rendah. Ini membuka pengembangan AI bagi startup, universitas, dan proyek komputasi tepi yang sebelumnya tidak dapat berpartisipasi dalam penelitian AI mutakhir karena kendala sumber daya. Ukuran model yang kecil juga memungkinkan penyebaran lokal, mengatasi kekhawatiran privasi yang terkait dengan layanan AI berbasis cloud.

Perbandingan Ukuran Model:

  • Samsung TRM: 7 juta parameter
  • Model bahasa besar pada umumnya: Miliaran parameter
  • Perbandingan performa: TRM menyamai atau melampaui model seperti Gemini 2.5 Pro, o3-mini, dan DeepSeek R1

Pergeseran Industri Menuju Pengembangan AI yang Berkelanjutan

Pencapaian Samsung datang pada momen kritis ketika industri AI menghadapi pengawasan yang semakin ketat atas dampak lingkungan dan biaya operasional. Sementara perusahaan seperti Meta dan Google terus mengejar model besar, mereka secara bersamaan berinvestasi dalam teknik seperti pruning dan kuantisasi untuk mengurangi tuntutan komputasi. Fokus Apple pada kecerdasan dalam perangkat mengikuti prinsip efisiensi yang serupa. Pendekatan TRM menunjukkan bahwa inovasi arsitektural, daripada sekadar kompresi model yang ada, mungkin menawarkan lompatan besar berikutnya dalam efisiensi AI. Seperti yang diperdebatkan oleh ilmuwan peneliti Alexia Jolicoeur-Martineau dan timnya, bidang ini semakin keliru menganggap volume sebagai kecerdasan, dan pekerjaan mereka menunjukkan bahwa desain yang lebih cerdas dapat menggantikan penskalaan secara paksa.

Aplikasi Masa Depan dan Arah Penelitian

Sementara TRM saat ini unggul dalam tugas penalaran terstruktur seperti teka-teki logika dan pencarian jalur, aplikasi potensialnya mencakup banyak domain. Perusahaan dapat menyebarkan model mikro khusus untuk tugas penalaran tertentu sambil menyimpan model bahasa besar untuk pembuatan teks, menciptakan sistem hibrida yang mengoptimalkan kinerja dan biaya. Pendekatan rekursif juga mungkin melengkapi sistem AI yang ada sebagai sub-modul khusus untuk penalaran matematis atau logis. Samsung telah membuat kode dan detail pelatihan tersedia secara terbuka di GitHub, mendorong adopsi dan adaptasi yang lebih luas oleh komunitas penelitian. Saat industri AI bergulat dengan tantangan keberlanjutan, TRM mewakili jalur alternatif yang menarik ke depan—di mana kecerdasan muncul bukan dari skala, tetapi dari desain arsitektural yang canggih.