Model GPT-5 yang sangat dinanti dari OpenAI telah tiba dengan sambutan kekecewaan, menandai perubahan signifikan dari prediksi berani CEO Sam Altman tentang superintelligence yang akan segera tiba. Peluncuran ini mewakili apa yang banyak orang anggap sebagai pemeriksaan realitas yang menyobatkan untuk klaim paling ambisius industri AI.
Performa Teknis Menunjukkan Hasil yang Beragam
Model baru ini menunjukkan peningkatan bertahap di beberapa area sambil tertinggal di area lain. GPT-5 berkinerja lebih baik daripada pendahulunya GPT-4o dalam tugas-tugas seperti pembuatan permainan catur dan penulisan skrip video, dan dapat mengalokasikan model yang paling sesuai untuk tugas-tugas spesifik secara cerdas. Namun, model ini kesulitan dengan tugas-tugas pembuatan gambar seperti thumbnail YouTube dan undangan pesta ulang tahun, di mana GPT-4o mempertahankan keunggulannya.
Yang lebih mengkhawatirkan adalah masalah teknis yang mengganggu peluncuran ini. Pengguna melaporkan respons yang lambat, halusinasi, dan kesalahan yang mengejutkan. Mekanisme perpindahan model antara GPT-5 dan GPT-4o telah rusak, menciptakan frustrasi di antara pelanggan berbayar yang mengharapkan pengalaman premium.
Hasil Benchmark Mengungkap Kemajuan Terbatas
Performa pada benchmark AI yang dihormati menceritakan kisah yang menyobarkan tentang kemampuan GPT-5 . Pada Abstraction and Reasoning Corpus for Artificial General Intelligence ( ARC-AGI-2 ), GPT-5 hanya mencetak skor 9,9%, tertinggal signifikan dari Grok-4 milik Elon Musk di 15,9%. Bahkan pada tes ARC-AGI-1 yang lebih lama, GPT-5 mencapai akurasi 67,5%, tidak mencapai model o3 OpenAI sendiri, yang mencetak skor 76% pada Desember 2024.
Performa coding menyajikan kekecewaan lain. Meskipun GPT-5 menunjukkan peningkatan dalam analisis repositori kode, pengujian mengungkap bahwa ini sebenarnya mewakili langkah mundur dalam kemampuan coding secara keseluruhan, gagal memberikan kemajuan yang mengubah permainan yang banyak diantisipasi.
Perbandingan Benchmark Kompetitif:
- Grok-4 ( xAI ): 15,9% pada ARC-AGI-2
- GPT-5 ( OpenAI ): 9,9% pada ARC-AGI-2
- Model OpenAI o3: 76% pada ARC-AGI-1 (Desember 2024)
- GPT-5: 67,5% pada ARC-AGI-1
Dilema Hukum Scaling
Performa GPT-5 yang mengecewakan telah memicu kembali perdebatan tentang asumsi fundamental yang mendorong pengembangan AI. Hukum scaling, yang menyarankan bahwa hanya dengan meningkatkan ukuran model dan intensitas pelatihan akan terus meningkatkan performa, tampaknya kehilangan kekuatan prediktifnya. Prinsip ini, yang diuraikan dalam penelitian OpenAI 2020 dan tampaknya divalidasi oleh kesuksesan GPT-3 , mungkin tidak lagi berlaku.
Pengamat industri mencatat bahwa sementara GPT-3 sepuluh kali lebih besar dari GPT-2 dengan lompatan performa yang sesuai, model-model terbaru menunjukkan hasil yang semakin berkurang meskipun investasi sumber daya yang masif. Metafora pengembangan AI telah bergeser dari membangun mobil yang lebih baik melalui pre-training menjadi menjadi mekanik yang fokus pada peningkatan post-training.
Pushback Akademis Terhadap Hype AI
Para peneliti semakin menantang klaim industri tentang kemampuan penalaran AI. Studi terbaru Apple menyimpulkan bahwa model penalaran besar gagal untuk secara konsisten bernalar dalam arti yang bermakna, menjadi tidak menentu ketika dihadapkan dengan masalah kompleks. Penelitian menemukan bahwa model-model ini mengalami keruntuhan akurasi total di luar kompleksitas tertentu.
Para peneliti Arizona State University juga telah membantah persepsi penalaran yang disengaja dalam model AI. Mereka menggambarkan output chain-of-thought yang bertele-tele sebagai fatamorgana rapuh yang menghilang ketika didorong melampaui distribusi pelatihan, menunjukkan bahwa kemampuan penalaran yang tampak lebih dangkal daripada yang terlihat.
Implikasi Ekonomi dari Kemajuan yang Terhenti
Implikasinya meluas jauh melampaui kekecewaan teknis. Jika hukum scaling memang telah gagal, ekonomi AI mungkin secara signifikan lebih kecil daripada yang diproyeksikan. Analis sekarang memperkirakan pasar AI generatif bisa mencapai 50-100 miliar dolar Amerika Serikat daripada valuasi triliunan dolar yang telah mendorong kegilaan investasi baru-baru ini.
Penilaian ulang ini datang pada saat kritis ketika perusahaan teknologi besar telah menginvestasikan 560 miliar dolar Amerika Serikat dalam AI selama 18 bulan terakhir sambil hanya menghasilkan 35 miliar dolar Amerika Serikat dalam pendapatan terkait. Dengan sekitar 35% nilai pasar saham Amerika Serikat terikat pada tujuh raksasa teknologi besar yang berinvestasi besar dalam AI, taruhannya untuk kemajuan berkelanjutan tetap sangat besar.
Investasi Industri AI vs Pendapatan (18 bulan terakhir):
- Total Investasi AI: USD 560 miliar
- Pendapatan AI yang Dihasilkan: USD 35 miliar
- Rasio Investasi terhadap Pendapatan: 16:1
Melihat ke Depan
Peluncuran GPT-5 berfungsi sebagai momen penting untuk hubungan industri AI dengan realitas. Meskipun model ini mewakili kemajuan teknis yang nyata, ini jauh dari terobosan revolusioner yang dijanjikan oleh retorika superintelligence Altman . Saat industri bergulat dengan keterbatasan pendekatan saat ini, fokus mungkin bergeser ke arah ekspektasi yang lebih realistis dan aplikasi praktis daripada klaim transformatif tentang artificial general intelligence.