Komunitas kecerdasan buatan sedang bergulat dengan tantangan mendasar yang dapat menentukan masa depan pengembangan AI. Sementara perusahaan teknologi besar seperti Google DeepMind , Meta , dan OpenAI berlomba membangun sistem AI dengan model dunia yang canggih - representasi internal tentang bagaimana dunia bekerja - bukti terkini menunjukkan bahwa sistem-sistem ini masih jauh dari pencapaian tujuan tersebut.
![]() |
---|
Perpaduan antara dunia miniatur di dalam bola salju dengan papan sirkuit menyoroti upaya komunitas AI dalam mengembangkan model dunia yang sesungguhnya di tengah keterbatasan saat ini |
Kesenjangan Antara Ekspektasi dan Realitas
Penelitian terbaru mengungkapkan bahwa model bahasa besar saat ini sebenarnya tidak mengembangkan model dunia yang koheren seperti yang diharapkan banyak ahli. Sebaliknya, mereka mempelajari apa yang disebut peneliti sebagai kumpulan heuristik - koleksi aturan-aturan terputus yang dapat menangani skenario spesifik tetapi tidak membentuk pemahaman yang terpadu. Penemuan ini memiliki implikasi signifikan terhadap keandalan dan kinerja AI.
Komunitas telah mengamati keterbatasan ini secara langsung melalui aplikasi praktis. Pengembang game yang bekerja dengan sistem AI melaporkan bahwa bahkan model paling canggih pun kesulitan dengan manajemen state dasar dan konsistensi aturan. Ketika ditugaskan dengan tantangan sederhana seperti menavigasi labirin langkah demi langkah, sistem-sistem ini dengan cepat menjadi bingung dan mulai membuat gerakan melingkar yang tidak logis.
Heuristik: Aturan sederhana atau jalan pintas yang digunakan untuk memecahkan masalah dengan cepat, tetapi tidak selalu akurat
Keterbatasan Model Dunia AI Saat Ini:
- Model bahasa besar menggunakan "kumpulan heuristik" alih-alih representasi dunia yang koheren
- Performa menurun drastis dengan perubahan lingkungan yang kecil (pemblokiran jalan 1% menyebabkan kegagalan sistem)
- Tidak dapat mempertahankan keadaan internal yang konsisten selama tugas berurutan
- Kesulitan dengan konsistensi aturan dasar dalam skenario permainan
Realitas Engine Catur
Komunitas gaming AI memberikan bukti yang meyakinkan tentang keterbatasan saat ini. Engine catur dan permainan papan tradisional masih mengungguli jaringan neural dengan mengimplementasikan aturan permainan eksplisit dan mencari ke depan beberapa langkah. AI modern membantu dengan fungsi evaluasi dan pemangkasan gerakan, tetapi model dunia inti - memahami aturan permainan dan gerakan yang valid - masih harus diprogram secara manual oleh manusia.
Tidak ada yang mengalahkan 'implementasikan logika permainan secara penuh dan dengan pemangkasan pada beberapa heuristik lihat 50 langkah ke depan'. Begitulah cara kerja engine catur dan bagaimana semua AI permainan berbasis giliran yang baik bekerja.
Bahkan sistem canggih seperti AlphaGo dan MuZero , meskipun kinerjanya mengesankan, memerlukan implementasi aturan yang diprogram manusia sebagai fondasinya. Komponen AI meningkatkan strategi dan evaluasi, tetapi tidak dapat menggantikan kebutuhan akan pemodelan dunia eksplisit.
Pemangkasan gerakan: Teknik untuk menghilangkan gerakan yang jelas-jelas buruk dari pertimbangan untuk mempercepat pengambilan keputusan
Mesin Game Tradisional vs AI:
- Mesin tradisional: Implementasi aturan eksplisit + pencarian pohon + evaluasi heuristik
- Sistem AI: Pencocokan pola tanpa pemahaman aturan yang sesungguhnya
- AlphaGo / MuZero : Masih memerlukan fondasi aturan yang diprogram manusia
- Mesin catur: Melihat ke depan 50+ langkah menggunakan model dunia yang diimplementasikan secara manual
Tantangan Teknis dalam Implementasi
Pengembang yang mencoba menciptakan sistem AI untuk permainan papan menghadapi pola yang konsisten. Sementara AI dapat menghasilkan kode bermain game ketika diberikan informasi lengkap, ia gagal ketika diminta untuk memelihara state secara internal atau beradaptasi dengan kondisi yang berubah. Studi navigasi jalan Manhattan yang disebutkan dalam penelitian asli mencontohkan kerapuhan ini - ketika hanya 1% jalan diblokir secara acak, kinerja AI runtuh sepenuhnya.
Komunitas telah bereksperimen dengan berbagai pendekatan untuk mengatasi keterbatasan ini. Beberapa pengembang mencoba membuat sistem AI menulis catatan rinci untuk diri mereka sendiri guna mempertahankan konteks di seluruh interaksi, tetapi bahkan pendekatan ini mengungkapkan kesenjangan mendasar. Sistem-sistem tersebut sering melupakan informasi penting seperti orientasi saat ini atau gagal menyertakan instruksi penting untuk menginterpretasikan representasi state mereka sendiri.
Pendekatan Penelitian yang Sedang Dieksplorasi:
- Data pelatihan multimodal (video, simulasi 3D, teks)
- Arsitektur khusus ( Tolman-Eichenbaum Machine )
- Dekoding terbatas tata bahasa untuk keluaran terstruktur
- Gaussian splatting sebagai representasi model dunia
- Arsitektur model yang merakit sendiri
Jalan ke Depan
Meskipun ada keterbatasan saat ini, komunitas AI tetap optimis tentang solusi potensial. Beberapa peneliti sedang mengeksplorasi arsitektur khusus seperti Tolman-Eichenbaum Machine , yang menunjukkan harapan dalam tugas-tugas pemecahan labirin dan menghasilkan pola aktivasi mirip otak. Yang lain sedang menyelidiki apakah jumlah data pelatihan multimodal yang masif mungkin akhirnya mengarah pada model dunia yang muncul.
Konsensus di antara praktisi adalah bahwa model dunia sejati tetap penting untuk mencapai sistem AI yang kuat. Tanpa itu, AI akan terus rapuh dan tidak dapat diandalkan ketika menghadapi situasi baru atau perubahan kecil pada lingkungan yang familiar.
Perjalanan menuju model dunia AI yang sejati mewakili salah satu tantangan paling signifikan di bidang ini. Sementara sistem saat ini dapat melakukan prestasi mengesankan melalui pencocokan pola statistik, membangun AI yang benar-benar memahami dan memodelkan dunia tetap menjadi masalah yang belum terpecahkan yang kemungkinan akan memerlukan terobosan mendasar dalam arsitektur dan pendekatan pelatihan.
Referensi: 'World Models,' an Old Idea in AI, Mount a Comeback