OpenAI Luncurkan GPT Image 1.5: Lebih Cepat dan Dapat Dikendalikan, Namun Realismenya Masih Kalah dari Pesaing

Tim Editorial BigGo
OpenAI Luncurkan GPT Image 1.5: Lebih Cepat dan Dapat Dikendalikan, Namun Realismenya Masih Kalah dari Pesaing

OpenAI secara resmi memasuki fase berikutnya dalam perlombaan generasi gambar AI dengan meluncurkan model terbarunya, GPT Image 1.5. Diumumkan pada 17 Desember 2025, model ini menjanjikan peningkatan signifikan dalam kecepatan, kemampuan mengikuti instruksi, dan fitur pengeditan, yang bertujuan untuk menantang pemimpin pasar saat ini. Namun, tes langsung awal dan umpan balik komunitas menunjukkan bahwa meskipun integrasi produknya mulus, kualitas output mentahnya mungkin masih tertinggal dari tolok ukur yang ditetapkan oleh pesaing seperti Google Nano Banana Pro.

Lompatan dalam Kecepatan dan Integrasi Produk

Peningkatan teknis utama untuk GPT Image 1.5 adalah kecepatan pemrosesannya, yang diklaim OpenAI empat kali lebih cepat dari pendahulunya. Akselerasi ini dirancang untuk merampingkan alur kerja kreatif, membuat pembuatan dan pengeditan berulang menjadi lebih praktis. Di luar kecepatan mentah, OpenAI telah mengintegrasikan model ini secara mendalam ke dalam ChatGPT, meluncurkan bagian khusus untuk generasi gambar. Antarmuka baru ini menawarkan berbagai templat dan opsi gaya yang sudah jadi, secara signifikan menurunkan hambatan masuk untuk membuat gambar yang kompleks atau bergaya. Langkah ini menegaskan strategi OpenAI yang memprioritaskan produk yang ramah pengguna, membuat alat AI canggih dapat diakses langsung dalam antarmuka obrolan yang familiar.

Spesifikasi Kunci & Harga GPT Image 1.5

  • Tanggal Rilis: 17 Desember 2025
  • Klaim Kecepatan: 4x lebih cepat dari model gambar OpenAI sebelumnya.
  • Harga (berbasis Token): Kualitas tinggi (1MP): ~USD 133 per 1.000 gambar Kualitas rendah: ~USD 9 per 1.000 gambar
  • Ketersediaan: Terintegrasi ke dalam ChatGPT untuk semua pengguna; API dirilis.

Kinerja dan Harga: Gambaran Tolok Ukur yang Beragam

OpenAI telah mengadopsi model penetapan harga berbasis token untuk GPT Image 1.5, dengan biaya yang disesuaikan berdasarkan resolusi dan pengaturan kualitas. Untuk gambar berkualitas tinggi berukuran satu megapiksel, harganya sekitar USD 133 per seribu generasi, sementara gambar berkualitas rendah berharga sekitar USD 9 per seribu. Semua pengguna ChatGPT mendapatkan akses ke model ini saat dirilis, dengan API-nya juga tersedia untuk pengembang. Dalam hal tolok ukur resmi, GPT Image 1.5 dilaporkan menduduki puncak peringkat baik untuk teks-ke-gambar maupun pengeditan gambar di situs web Artificial Analysis, melampaui Google Nano Banana Pro. Model ini juga mencapai posisi terdepan serupa di arena model LMArena, menunjukkan kinerja yang kuat dalam lingkungan pengujian terkontrol.

Kinerja Benchmark yang Dilaporkan (per 17 Des 2025)

  • Artificial Analysis: Peringkat 1 di papan peringkat Text-to-Image dan Image Editing.
  • LMArena: Peringkat 1 di papan peringkat Text-to-Image dan Image Editing.
  • Catatan: OpenAI belum merilis data benchmark resmi mereka sendiri.## Tes Langsung Mengungkap Estetika "Kental" dan Kesulitan Detail Meskipun skor tolok ukurnya menjanjikan, tes independen yang dilakukan oleh media teknologi dan pengguna mengungkap kesenjangan yang nyata dalam kualitas output. Saat menghasilkan adegan kompleks, seperti malam hujan di Tokyo dengan banyak elemen yang ditentukan, hasil GPT Image 1.5 sering digambarkan memiliki "vibe AI" yang khas atau perasaan "kental", dengan warna yang terlalu jenuh dan perpaduan yang tidak alami antara subjek latar depan dan latar belakang. Kesalahan kritis, seperti menghasilkan tangan dengan hanya empat jari, diamati, yang dianggap sebagai kegagalan dasar untuk model era 2025. Dalam tugas transfer gaya, seperti menciptakan ulang sebuah adegan dalam gayaThe Starry Night karya Vincent van Gogh, model ini kesulitan menangkap secara akurat goresan kuas dan palet warna khas dari mahakarya aslinya, di mana pesaing berhasil.

Temuan Komunitas & Uji Tangan Langsung vs. Nano Banana Pro

Area Uji Observasi GPT Image 1.5 Observasi Nano Banana Pro (untuk perbandingan)
Estetika Sering terlihat "kental," terlalu jenuh, memiliki "vibe AI." Lebih alami, kualitas fotografis; ketidaksempurnaan kecil menambah realisme.
Akurasi Detail Kesulitan dengan prompt kompleks (misalnya, detail tangan yang hilang). Rentan terhadap kesalahan seperti anatomi yang tidak tepat. Akurasi tinggi dalam mereplikasi detail prompt.
Transfer Gaya Dapat melewatkan elemen artistik inti (misalnya, goresan kuas Van Gogh). Lebih setia pada karakteristik gaya yang diminta.
Kasus Tepi Kinerja menurun secara signifikan (misalnya, perspektif yang terdistorsi). Menangani prompt yang tidak biasa dengan lebih kokoh.
Kecepatan Lebih cepat dari pendahulunya, tetapi dilaporkan lebih lambat dari Nano Banana Pro dalam beberapa uji. Dicatat untuk waktu pembuatan yang cepat (~15 detik dalam satu uji).
Kekuatan Kemampuan mengikuti instruksi yang kuat untuk pengeditan, fusi multi-elemen yang baik, integrasi produk yang sangat baik. Baseline realisme dan konsistensi detail yang tinggi.

Kasus Tepi dan Realisme Tertinggal dari Kompetisi

Kelemahan model ini menjadi lebih jelas dalam skenario kasus tepi. Sebuah perintah yang meminta perspektif orang pertama dari seekor kucing menghasilkan gambar yang sangat terdistorsi dengan detail yang tidak konsisten, gagal menyampaikan sudut pandang yang diminta dengan meyakinkan. Dalam perbandingan berdampingan yang dibagikan secara online, potret yang dihasilkan oleh GPT Image 1.5 sering menunjukkan masalah proporsi, seperti kepala yang terlalu besar, dan pencahayaan yang kurang alami dibandingkan dengan yang dari Nano Banana Pro. Pengguna mencatat bahwa output Nano Banana Pro terkadang menyertakan ketidaksempurnaan kecil seperti jendela yang sedikit terlalu terang, yang ironisnya justru memberikan rasa realisme fotografis yang lebih besar. Beberapa penguji menemukan bahwa hasil GPT Image 1.5 dapat ditingkatkan dengan menambahkan arahan fotografis spesifik seperti "foto iPhone yang belum diproses" ke dalam perintah, menunjukkan bahwa estetika defaultnya terlalu diproses.

Kekuatan dalam Pengeditan dan Fusi Multi-Elemen

Di mana GPT Image 1.5 menunjukkan janji yang cukup besar adalah dalam kemampuan pengeditan dan komposit gambarnya. OpenAI mendemonstrasikan kemampuan model untuk melakukan pertukaran elemen kompleks—mengubah warna pakaian, jenis kendaraan, dan rambu jalan dalam gambar yang ada dengan akurasi tinggi. Model ini juga mendukung fusi multi-elemen, seperti menempatkan beberapa orang dan seekor anjing ke dalam satu adegan yang kohesif berdasarkan deskripsi perintah. Templat gaya bawaan memungkinkan transformasi cepat, seperti mengubah foto kepala perusahaan menjadi sampul kaset kebugaran VHS era 80-an atau sebuah adegan menjadi estetika permainan boneka pink awal 2000-an, menunjukkan utilitasnya untuk remix kreatif yang cepat.

Kesimpulan: Produk yang Dipoles Menunggu Terobosan Model

Peluncuran GPT Image 1.5 mewakili pembaruan iteratif yang solid dari OpenAI, unggul dalam pengalaman pengguna, kecepatan, dan kendali kreatif melalui pengeditan dan templat. Integrasinya yang mulus ke dalam ChatGPT membuat generasi gambar yang kuat lebih mudah diakses dari sebelumnya. Namun, konsensus dari pengujian awal adalah bahwa model intinya masih tertinggal dari standar terkini di area kritis seperti realisme, konsistensi detail, dan keandalan dengan perintah yang kompleks atau tidak biasa. Di pasar di mana harapan pengguna telah dinaikkan tajam oleh pesaing, GPT Image 1.5 memberikan pengalaman produk yang superior tetapi masih menyisakan ruang untuk perbaikan dalam mesin generatif dasarnya. Penerimaan pasarnya pada akhirnya akan bergantung pada seberapa besar pengguna menghargai alur kerja yang efisien dibandingkan ketelitian output tertinggi.