Peluncuran GPT-5 OpenAI Menghadapi Reaksi Keras Pengguna Akibat Penghapusan Model dan Masalah Performa

Tim Editorial BigGo

Peluncuran GPT-5 OpenAI Menghadapi Reaksi Keras Pengguna Akibat Penghapusan Model dan Masalah Performa

Peluncuran GPT-5 yang sangat dinanti dari OpenAI telah memicu kontroversi signifikan dalam 24 jam setelah diluncurkan, karena pengguna mengungkapkan ketidakpuasan yang meluas terhadap performa model baru dan keputusan perusahaan untuk menghapus akses ke versi sebelumnya tanpa peringatan. Peluncuran yang dimaksudkan untuk menampilkan sistem AI paling canggih OpenAI hingga saat ini, malah menjadi titik fokus frustrasi pengguna dan kritik teknis.

Arsitektur Revolusioner Bertemu Sambutan Beragam

GPT-5 memperkenalkan pendekatan yang secara fundamental berbeda untuk pemrosesan AI melalui sistem kecerdasan terpadu. Tidak seperti arsitektur model tunggal sebelumnya, GPT-5 beroperasi sebagai sistem routing cerdas yang mengelola dua komponen inti: model default berkecepatan tinggi untuk tugas rutin dan GPT-5 Thinking untuk masalah penalaran kompleks. Router real-time ini menganalisis kueri pengguna untuk menentukan jalur pemrosesan yang tepat, secara teoritis mengoptimalkan kecepatan dan akurasi. Pengguna juga dapat secara manual memicu analisis yang lebih mendalam dengan menyertakan frasa seperti tolong pikirkan masalah ini secara mendalam dalam prompt mereka.

Klaim Performa Versus Pengalaman Pengguna

Data benchmark OpenAI menunjukkan peningkatan mengesankan di berbagai domain. Dalam kemampuan rekayasa perangkat lunak yang diukur dengan pengujian SWE-bench , GPT-5 mencapai akurasi 74,9% dibandingkan dengan 30,8% dari GPT-4o . Penalaran matematika mengalami peningkatan yang lebih dramatis, dengan GPT-5 mencapai akurasi 94,6% pada masalah kompetisi AIME tanpa bantuan alat, secara substansial lebih tinggi dari 42,1% GPT-4o . Perusahaan juga mengklaim pengurangan 45% dalam kesalahan faktual dibandingkan model sebelumnya, dengan peningkatan 80% saat menggunakan mode thinking.

Namun, pengujian pengguna di dunia nyata mengungkapkan kesenjangan signifikan antara klaim ini dan performa aktual. Pengguna melaporkan kegagalan dasar seperti salah menghitung huruf dalam kata sederhana seperti blueberry, menghasilkan peta Amerika Serikat yang tidak masuk akal, dan kesulitan dengan persamaan matematika dasar yang ditangani dengan benar oleh model pesaing. Kesalahan fundamental ini telah menimbulkan pertanyaan tentang validitas metodologi pengujian benchmark OpenAI .

Benchmark Performa GPT-5

Kategori Tes	Skor GPT-5	Skor GPT-4o	Peningkatan
SWE-bench (Rekayasa Perangkat Lunak)	74,9%	30,8%	+144%
Kompetisi Matematika AIME	94,6%	42,1%	+125%
Pengurangan Kesalahan Faktual	45% lebih sedikit kesalahan dibanding GPT-4o	-	-45%
Pengurangan Kesalahan Mode Berpikir	80% lebih sedikit kesalahan dibanding o3	-	-80%


Perbandingan skenario pemecahan masalah yang menyoroti perbedaan antara ekspektasi pengguna dan performa model GPT-5

Strategi Penghentian Model yang Kontroversial

Sumber kemarahan pengguna yang paling signifikan berasal dari penghapusan tanpa pemberitahuan OpenAI terhadap semua model sebelumnya, termasuk varian GPT-4o , o3 , dan 4.5 . Keputusan ini menghilangkan pilihan pengguna dalam semalam, memaksa semua orang menggunakan sistem GPT-5 baru terlepas dari preferensi atau kasus penggunaan spesifik mereka. Banyak pengguna telah mengembangkan alur kerja di sekitar model yang berbeda untuk tujuan yang berbeda, menggunakan GPT-4o untuk tugas kreatif, o3 untuk penalaran logis, dan varian lain untuk aplikasi khusus.

Dampak emosional dari perubahan ini sangat mencolok, dengan beberapa pengguna menggambarkan keterikatan mereka pada model tertentu dalam istilah yang mengejutkan personal. Beberapa pengguna melaporkan menggunakan GPT-4o untuk dukungan kesehatan mental, menemukan responsnya lebih empatik dan mirip manusia daripada sistem baru. Hilangnya akses secara tiba-tiba telah menyebabkan pembatalan langganan dan seruan boikot di platform media sosial.

Ringkasan Keluhan Pengguna

Masalah Teknis:

Penghitungan huruf yang salah pada kata-kata sederhana
Kegagalan persamaan matematika dasar
Pembuatan peta geografis yang tidak masuk akal
Kesenjangan performa dibandingkan klaim benchmark

Masalah Kebijakan:

Penghapusan semua model sebelumnya tanpa pemberitahuan
Migrasi paksa ke sistem GPT-5
Pilihan model terbatas untuk pengguna non-Pro
Timeline yang tidak jelas untuk ketersediaan model lama

Strategi Harga dan Posisi Pasar

Meskipun ada kontroversi teknis, struktur harga GPT-5 mewakili pergeseran signifikan dalam strategi pasar OpenAI . Harga API ditetapkan pada 1,25 dolar Amerika Serikat per juta token input dan 10,00 dolar Amerika Serikat per juta token output, dengan varian GPT-5 mini yang lebih ekonomis tersedia. Lebih penting lagi, GPT-5 sedang diluncurkan ke semua tingkat pengguna, termasuk pengguna gratis yang akan memiliki akses ke sistem dengan batas penggunaan sebelum beralih ke versi mini.

Pendekatan harga agresif ini tampaknya dirancang untuk menekan pesaing seperti Gemini dari Google dan Claude dari Anthropic , terutama karena perusahaan-perusahaan ini telah membangun posisi mereka di sekitar keunggulan spesifik seperti pemrosesan konteks panjang dan fitur keamanan. Langkah ini juga menantang alternatif open-source, meskipun proyek seperti DeepSeek dan Tongyi Qianwen mungkin mendapat manfaat dari pengguna yang mencari alternatif ekosistem OpenAI .

Struktur Harga GPT-5

Input API: USD 1,25 per juta token
Output API: USD 10,00 per juta token
Pengguna Gratis: Akses ke GPT-5 dengan batasan penggunaan, kemudian otomatis beralih ke GPT-5 mini
Pengguna Plus: Kuota penggunaan lebih tinggi + akses sementara GPT-4o
Pengguna Pro: USD 200/bulan untuk pemilihan model manual dan akses GPT-5 Pro


GPT-5 dipromosikan sebagai model terbaik untuk pekerjaan, dirancang untuk membantu bisnis menyelesaikan berbagai tugas dengan lebih efisien

Respons Perusahaan dan Kontrol Kerusakan

Menghadapi kritik yang meningkat, CEO OpenAI Sam Altman dengan cepat mengumumkan beberapa tindakan korektif melalui media sosial. Perusahaan menggandakan batas tingkat untuk pengguna ChatGPT Plus , berjanji meningkatkan kecerdasan model, dan yang penting, memulihkan akses ke GPT-4o untuk pelanggan berbayar. Altman mengakui bahwa peluncuran berjalan lebih lambat dari yang diharapkan dan berkomitmen untuk membuat pemilihan model lebih transparan bagi pengguna.

Keputusan untuk mengembalikan GPT-4o , bahkan sementara, mewakili mundur signifikan dari strategi awal OpenAI untuk memaksa pengguna menggunakan sistem baru. Namun, perusahaan belum berkomitmen pada ketersediaan jangka panjang model lama, meninggalkan pengguna tidak pasti tentang akses masa depan ke alat AI pilihan mereka.

Implikasi Industri dan Pandangan Masa Depan

Kontroversi peluncuran GPT-5 menyoroti kompleksitas yang berkembang dari penyebaran model AI karena sistem ini menjadi lebih terintegrasi ke dalam alur kerja harian pengguna. Reaksi emosional yang kuat terhadap perubahan model menunjukkan bahwa perusahaan AI mungkin perlu mempertimbangkan kembali pendekatan mereka terhadap transisi produk, terutama karena pengguna mengembangkan ketergantungan yang lebih dalam pada perilaku dan kemampuan AI tertentu.

Untuk industri AI yang lebih luas, situasi ini menunjukkan bahwa benchmark teknis mungkin tidak diterjemahkan langsung ke kepuasan pengguna, terutama ketika strategi penyebaran mengganggu pola pengguna yang sudah mapan. Insiden ini juga menggarisbawahi pentingnya pilihan pengguna dan transparansi dalam desain sistem AI, karena fitur auto-switching yang dipromosikan OpenAI sebagai keunggulan dipersepsikan oleh banyak pengguna sebagai keterbatasan pada kontrol dan fleksibilitas mereka.


Sebuah grafik promosi yang menampilkan model GPT-5 canggih, menyoroti kemampuan-kemampuannya di tengah kekhawatiran pengguna dan implikasi industri

Berita Terkait

‌

‌
‌

‌

‌
‌

‌