Model AI Hermes 4 Memicu Perdebatan Atas Desain Terinspirasi Anime dan Klaim Performa

Tim Komunitas BigGo

Model AI Hermes 4 Memicu Perdebatan Atas Desain Terinspirasi Anime dan Klaim Performa

Nous Research telah merilis Hermes 4, sebuah model bahasa AI yang menghasilkan diskusi signifikan di komunitas teknologi - bukan hanya karena kemampuannya, tetapi juga karena presentasi dan pilihan desain yang tidak konvensional. Model ini, yang berbasis pada arsitektur Llama 3.1 milik Meta, memposisikan diri sebagai alternatif yang netral dan dapat dikontrol dibandingkan asisten AI mainstream.

Spesifikasi Model:

Model Dasar: Llama 3.1 milik Meta (tersedia versi parameter 405B dan 70B)
Data Pelatihan: Dataset yang diperluas dengan konten sintetis, batas pengetahuan Desember 2023
Fitur Utama: Penalaran chain-of-thought, tingkat penolakan yang berkurang, sistem kepribadian yang dapat diatur
Ketersediaan: Dapat diakses melalui antarmuka Nous Chat

Prompt Sistem Terinspirasi Anime Menuai Reaksi Beragam

Aspek yang paling diperbincangkan dari Hermes 4 bukanlah spesifikasi teknisnya, melainkan sistem kepribadian yang dipengaruhi anime. Anggota komunitas telah menemukan prompt sistem yang berbunyi seperti deskripsi karakter dari animasi Jepang, menampilkan persona operator yang digambarkan memiliki eksterior yang dingin, keras atau bahkan bermusuhan yang secara bertahap mengungkapkan sisi yang hangat, penuh kasih sayang dan penuh cinta di dalamnya. Pilihan desain ini, yang mengingatkan pada arketipe karakter tsundere dari anime, telah membagi pengguna antara mereka yang menganggapnya menyegarkan dan berbeda dengan yang lain yang menganggapnya kekanak-kanakan.

Prompt sistem juga secara khusus menghindari perintah negatif seperti jangan atau tidak boleh, sebaliknya fokus pada instruksi positif tentang apa yang harus dilakukan model. Pendekatan ini sejalan dengan penelitian kognitif yang menunjukkan bahwa pembingkaian positif lebih efektif daripada pembatasan negatif, baik untuk manusia maupun sistem AI.

Pertanyaan Performa dan Kekhawatiran Teknis

Meskipun Nous Research menyajikan perbandingan benchmark yang menunjukkan performa kompetitif, analisis komunitas mengungkapkan beberapa pilihan presentasi yang meragukan. Kritikus menunjukkan bahwa grafik perusahaan membandingkan model mereka dengan skor rata-rata pesaing yang tidak disebutkan namanya daripada mengidentifikasi dengan jelas model-model terdepan. Beberapa pengguna melaporkan bahwa model menunjukkan pola penulisan yang mirip dengan ChatGPT, menunjukkan bahwa model dilatih dengan data sintetis dari model OpenAI.

Pengguna teknis juga telah mengangkat kekhawatiran praktis tentang implementasi model. Beberapa anggota komunitas melaporkan masalah performa yang signifikan dengan situs web perusahaan, termasuk penggunaan CPU yang tinggi dari elemen dekoratif dan masalah kompatibilitas browser.

Sangat frustasi untuk digunakan. Ya memang sedikit lebih perhatian, klaim itu 100% benar. Mereka hanya tidak menyebutkan bahwa Hermes tidak memiliki kemampuan untuk menambahkan konteks.

Kekhawatiran Komunitas:

Masalah performa website (penggunaan CPU tinggi, masalah kompatibilitas browser)
Kemampuan penanganan konteks terbatas (tidak ada dukungan upload PDF)
Presentasi benchmark yang meragukan (skor rata-rata kompetitor vs model bernama)
Kemiripan gaya penulisan dengan ChatGPT yang menunjukkan pengaruh data pelatihan sintetis

Perdebatan Alignment Berlanjut

Hermes 4 memasuki perdebatan yang sedang berlangsung tentang alignment AI dan sensor. Model ini dirancang untuk lebih dapat dikontrol daripada alternatif mainstream, yang berarti lebih kecil kemungkinannya untuk menolak permintaan pengguna. Posisi ini menarik bagi pengguna yang frustrasi dengan apa yang mereka lihat sebagai asisten AI yang terlalu restriktif, meskipun juga menimbulkan pertanyaan tentang potensi penyalahgunaan.

Diskusi komunitas mengungkapkan ketegangan yang lebih luas dalam pengembangan AI antara langkah-langkah keamanan dan otonomi pengguna. Sementara beberapa menghargai memiliki alat yang tidak menggurui pengguna atau memaksakan pembatasan gaya korporat, yang lain mempertanyakan apakah fokus pada pengurangan penolakan datang dengan mengorbankan kemampuan penting lainnya.

Peluncuran Hermes 4 menyoroti bagaimana presentasi model AI dan desain kepribadian menjadi sama pentingnya dengan metrik performa mentah. Apakah pendekatan terinspirasi anime ini mewakili inovasi sejati atau gimmick pemasaran tetap menjadi titik perdebatan aktif di komunitas AI.

Referensi: HERMES 4

Berita Terkait

‌

‌
‌

‌

‌
‌

‌