Pengguna GPT-5 Melaporkan Masalah Performa dan Fitur yang Hilang Setelah Rilis Terbaru OpenAI

Tim Komunitas BigGo
Pengguna GPT-5 Melaporkan Masalah Performa dan Fitur yang Hilang Setelah Rilis Terbaru OpenAI

Rilis terbaru GPT-5 dari OpenAI telah memicu diskusi luas di kalangan pengguna yang melaporkan pengalaman beragam dengan model baru tersebut. Meskipun perusahaan memposisikan GPT-5 sebagai kemajuan signifikan, banyak pengguna merasa kecewa dengan berbagai aspek performa dan fungsionalitasnya.

Masalah Kualitas dan Routing Model

Pengguna melaporkan perbedaan kualitas yang mencolok antara GPT-5 dan model-model pendahulunya. Banyak yang menemukan bahwa GPT-5 menghasilkan lebih sedikit putaran pemikiran dibandingkan model O3 sebelumnya dan tidak memanfaatkan pencarian web secara efektif. Custom GPT, yang diandalkan banyak pengguna untuk tugas-tugas khusus, tampak rusak dan mengabaikan instruksi terlepas dari model yang dipilih. Fungsionalitas riset mendalam, fitur kunci bagi banyak pengguna profesional, tampak tidak berfungsi bahkan ketika dipilih secara eksplisit.

Sistem routing model, yang dirancang untuk secara otomatis memilih model terbaik untuk setiap tugas, telah menjadi sumber frustrasi. Pengguna melaporkan bahwa keputusan routing kurang transparan, dan mereka tidak dapat dengan mudah mengontrol model spesifik mana yang menangani permintaan mereka. Hal ini menyebabkan hasil yang tidak dapat diprediksi dan mengurangi kepercayaan pengguna terhadap sistem.

Masalah Teknis yang Dilaporkan:

  • Custom GPTs mengabaikan instruksi terlepas dari model yang dipilih
  • Fitur riset mendalam tampak tidak berfungsi
  • Proses pembersihan konteks menyebabkan hilangnya thread percakapan
  • Masalah halusinasi tetap berlanjut dalam domain khusus
  • Penalaran spasial dan pemrosesan gambar masih bermasalah
  • Routing model kurang transparan dan kontrol pengguna

Masalah Konteks dan Manajemen Percakapan

Masalah signifikan yang mempengaruhi pengalaman pengguna adalah kesulitan GPT-5 dalam mempertahankan konteks percakapan. Pengguna menggambarkan situasi di mana model kehilangan alur percakapan secara tiba-tiba, memerlukan prompt seperti Tolong tinjau percakapan terbaru sebelum melanjutkan untuk kembali ke jalur yang benar. Respons juga menjadi lebih singkat secara mencolok, menciptakan pengalaman yang mengejutkan seperti berbicara dengan seseorang yang tidak mendengarkan.

Masalah manajemen konteks ini tampaknya berasal dari proses pembersihan konteks yang agresif yang mungkin merangkum highlight percakapan dengan buruk, secara efektif memberikan model memori kerja yang lebih kecil dari yang diharapkan.

Trade-off Performa vs Biaya

Rilis ini tampaknya merupakan bagian dari strategi OpenAI untuk mengelola biaya sambil melakukan scaling ke basis pengguna yang lebih besar. Pengamat industri mencatat bahwa menjalankan model-model ini pada performa maksimum dapat menelan biaya ribuan dolar Amerika Serikat per pengguna per bulan. Desain GPT-5 tampak dioptimalkan untuk adopsi massal daripada performa puncak, yang menjelaskan mengapa pengguna power yang terbiasa dengan kemampuan O3 merasa kecewa.

Menariknya, GPT-5 Pro, versi premium, menunjukkan performa yang lebih baik dalam tugas coding dan dapat memecahkan masalah kompleks yang membuat model-model sebelumnya kesulitan. Namun, ia hadir dengan biaya yang lebih tinggi dan batasan rate yang membuatnya kurang dapat diakses untuk penggunaan reguler.

Perbandingan GPT-5 vs Model Sebelumnya:

  • Manajemen Konteks: GPT-5 menunjukkan kemampuan yang menurun dalam mempertahankan alur percakapan dibandingkan O3
  • Pencarian Web: Integrasi pencarian web yang kurang efektif dibandingkan model O3 sebelumnya
  • Custom GPTs: Fungsionalitas rusak, mengabaikan instruksi pengguna
  • Riset Mendalam: Tidak berfungsi meskipun sudah dipilih secara eksplisit
  • Gaya Respons: Respons yang lebih singkat, putaran pemikiran yang berkurang
  • Biaya: Dirancang untuk adopsi massal daripada performa puncak

Keterbatasan Teknis Masih Ada

Meskipun ada rilis baru, masalah fundamental yang telah mengganggu large language model terus mempengaruhi GPT-5. Model masih kesulitan mengatakan saya tidak tahu ketika kekurangan informasi, alih-alih menghasilkan respons yang terdengar percaya diri namun salah. Masalah halusinasi ini terutama mempengaruhi domain khusus di mana pengguna membutuhkan informasi yang dapat diandalkan dan akurat.

Kemampuan penalaran spasial dan pemrosesan gambar model tetap bermasalah, dengan pengguna melaporkan bahwa model gagal dalam tugas visual dasar dan menghasilkan respons yang tidak masuk akal ketika bekerja dengan gambar.

Adaptasi Pengguna dan Ekspektasi

Respons komunitas menyoroti tantangan yang lebih luas dalam pengembangan AI: mengelola ekspektasi pengguna versus realitas teknis. Meskipun GPT-5 mewakili peningkatan inkremental di beberapa area, ia gagal memenuhi kemajuan revolusioner yang diharapkan banyak pengguna. Beberapa pengguna telah beradaptasi dengan menggunakan multiple model AI untuk tugas yang berbeda, memperlakukan masing-masing sebagai alat khusus daripada solusi serbaguna.

Penerimaan yang beragam terhadap GPT-5 mencerminkan keadaan pengembangan AI saat ini, di mana kemajuan datang dalam langkah-langkah kecil daripada lompatan dramatis. Pengguna sedang belajar menavigasi kekuatan dan kelemahan model yang berbeda, sering kali mempertahankan langganan ke multiple layanan untuk mengakses alat terbaik untuk setiap tugas spesifik.

Referensi: GPT-5: Overdan, overhyped and underwhelming. And that's not the worst of it.