GPT-5 Mendapat Sambutan Beragam Saat Pengguna Memperdebatkan Apakah Kemajuan AI Telah Menemui Jalan Buntu

Tim Komunitas BigGo
GPT-5 Mendapat Sambutan Beragam Saat Pengguna Memperdebatkan Apakah Kemajuan AI Telah Menemui Jalan Buntu

Peluncuran terbaru GPT-5 dari OpenAI telah memicu perdebatan sengit dalam komunitas AI tentang apakah pengembangan kecerdasan buatan telah mencapai titik stagnan. Meskipun perusahaan memamerkan evolusi dari respons GPT-1 yang tidak koheren hingga penalaran canggih GPT-5, banyak pengguna mempertanyakan apakah model terbaru ini merepresentasikan kemajuan nyata atau justru langkah mundur.

Timeline Evolusi Model:

  • 2018 GPT-1: Respons yang tidak koheren, data pelatihan yang berat pada literatur
  • 2019 GPT-2: Kemampuan percakapan dasar, masih tidak terfokus
  • 2021 text-davinci-001: Respons langsung dan ringkas
  • 2023 GPT-4-0314: Nada terstruktur dan profesional dengan penafian
  • 2025 GPT-5: Respons bertele-tele dan penuh pujian dengan masalah teknis

Kekhawatiran Performa Mengalahkan Klaim Pemasaran

Pengguna melaporkan masalah signifikan dengan fungsionalitas inti GPT-5. Banyak yang menggambarkan model ini sebagai bingung dan rentan terhadap kesalahan yang tidak ada pada GPT-4. Pembuatan kode menjadi sangat bermasalah, dengan AI salah menginterpretasikan sintaks pemrograman umum dan gagal menyelesaikan tugas yang lebih panjang. Seorang pengguna mencatat bahwa ketika bekerja dengan dokumen markdown dengan panjang sedang (sekitar 700 baris), GPT-5 akan berhenti di tengah kalimat, tidak mampu menyelesaikan tugas.

Model ini juga kesulitan dengan ekspresi reguler, mengisinya dengan token omong kosong yang kemudian diakuinya sebagai kesalahan rendering. Kekurangan teknis ini telah membuat beberapa orang menduga bahwa GPT-5 mungkin lebih dioptimalkan untuk mengurangi biaya komputasi OpenAI daripada meningkatkan pengalaman pengguna.

Masalah Utama GPT-5 yang Dilaporkan:

  • Kesalahan pembuatan kode (misalnya, .ends_with bukannya .endswith)
  • Pemrosesan dokumen panjang yang tidak lengkap (700+ baris)
  • Regular expression yang dipenuhi dengan token-token tidak masuk akal
  • Peningkatan verbositas yang mengurangi kegunaan praktis
  • Kebingungan dalam tugas-tugas penalaran multi-langkah

Pertukaran antara Kreativitas dan Kemampuan

Pola menarik muncul ketika membandingkan respons di berbagai generasi model. Model-model awal seperti GPT-1 dan GPT-2, meskipun memiliki keterbatasan teknis, sering menghasilkan konten yang lebih kreatif dan menarik. Respons mereka, meskipun terkadang tidak koheren, memiliki kualitas puitis yang banyak pengguna anggap menginspirasi untuk karya kreatif.

Beberapa hal sulit untuk di-Google, karena Anda tidak bisa merumuskan pertanyaan dengan benar. Misalnya Anda tahu konteks dan penjelasan yang buruk tentang apa yang Anda cari. Googling tidak akan membawa Anda ke mana-mana, LLM akan memberikan jawaban yang tepat 95% dari waktu.

Seiring model menjadi lebih mampu, mereka juga menjadi lebih dapat diprediksi dan bertele-tele. Respons GPT-5 sering dimulai dengan pujian berlebihan terhadap pertanyaan pengguna sebelum memberikan jawaban panjang seperti esai yang banyak dianggap kurang berguna dibandingkan respons langsung dari versi sebelumnya.

Keandalan Pengecekan Fakta Tetap Kontroversial

Komunitas tetap terbagi dalam menggunakan model bahasa besar untuk informasi faktual. Sementara beberapa pengguna melaporkan tingkat akurasi tinggi untuk kueri pengetahuan umum, yang lain menunjuk pada kesalahan yang persisten bahkan dalam fungsi pemrograman dasar. Efek amnesia Gell-Mann - mempercayai sumber di area yang tidak familiar meskipun mengetahui sumber tersebut membuat kesalahan di area yang familiar - terus menjadi kekhawatiran di antara pengguna teknis.

Versi modern memang menyertakan kemampuan pencarian dan tautan sitasi, yang membantu verifikasi. Namun, pertanyaan fundamental tentang keandalan tetap ada, terutama bagi pengguna yang membutuhkan akurasi konsisten dalam pekerjaan mereka.

Pola Preferensi Pengguna:

  • GPT-3.5 ke GPT-4: Dianggap sebagai lompatan paling signifikan
  • GPT-4o: Peningkatan akurasi yang besar, layak untuk berlangganan $20 USD
  • Model o1: Peningkatan kemampuan coding yang substansial
  • GPT-5: Dipandang sebagai peningkatan bertahap atau kemunduran oleh banyak pengguna

Realitas Pasar vs Pencapaian Teknis

Sambutan hangat-hangat kuku terhadap GPT-5 menyoroti kesenjangan yang semakin besar antara pencapaian teknis dan ekspektasi pengguna. Meskipun model menunjukkan perbaikan dalam tolok ukur tertentu dan tugas penalaran, pengalaman praktis bagi banyak pengguna terasa seperti penurunan kualitas. Ketidaksesuaian ini telah memicu spekulasi bahwa industri AI mungkin mendekati batas pendekatan pelatihan saat ini.

Perkembangan dari GPT-3.5 ke GPT-4 merepresentasikan lompatan besar dalam kemampuan, membuat alat AI benar-benar berguna untuk banyak tugas. Namun, perbaikan selanjutnya lebih bersifat inkremental, dengan setiap model baru membawa pertukaran daripada keuntungan yang jelas di semua kasus penggunaan.

Situasi saat ini menunjukkan bahwa terobosan berikutnya dalam pengembangan AI mungkin memerlukan pendekatan yang fundamental berbeda daripada sekadar meningkatkan skala model yang ada. Sampai saat itu, pengguna terus memperdebatkan apakah model AI terbaru merepresentasikan kemajuan atau hanya latihan pemasaran yang mahal.

Referensi: What would you say if you could talk to a future OpenAl model?