OpenAI Luncurkan GPT-5.2: Tolok Ukur Baru dalam Penalaran dan Pemrograman AI

Tim Editorial BigGo
OpenAI Luncurkan GPT-5.2: Tolok Ukur Baru dalam Penalaran dan Pemrograman AI

Sebagai respons cepat terhadap persaingan yang semakin ketat, OpenAI secara resmi meluncurkan GPT-5.2, model AI generatif paling mutakhir mereka hingga saat ini. Peluncuran ini, yang datang kurang dari sebulan setelah GPT-5.1, menandakan fase intens dalam perlombaan senjata AI dan menghadirkan klaim peningkatan signifikan dalam penalaran, akurasi, dan kinerja tugas profesional. Artikel ini membahas apa yang baru, bagaimana performanya, dan apa artinya bagi pengguna serta lanskap persaingan.

Peluncuran Strategis GPT-5.2

Pengumuman OpenAI tentang GPT-5.2 pada 11 Desember dibingkai oleh perusahaan sebagai langkah kompetitif langsung. CEO Sam Altman sebelumnya telah menyatakan status "siaga merah" di dalam perusahaan menyusul peluncuran mengesankan model Google Gemini 3 pada November. Siklus rilis yang dipercepat ini—dari GPT-5 pada Agustus ke GPT-5.1 pada November dan kini GPT-5.2 pada Desember—menggarisbawahi tekanan sengit yang dirasakan OpenAI dari pesaing seperti Anthropic dan Google. Altman menunjukkan bahwa dampak Gemini 3 tidak separah yang awalnya dikhawatirkan dan memproyeksikan bahwa OpenAI akan keluar dari status "siaga merah"-nya pada Januari 2026 dalam posisi yang "sangat kuat".

Peningkatan Utama dan Varian Model

GPT-5.2 bukanlah pembaruan serba sama. OpenAI memperkenalkan tiga versi berbeda yang disesuaikan untuk berbagai kasus penggunaan, yang semuanya kini tersedia untuk pengguna ChatGPT berbayar (Plus, Pro, Go, Business, Enterprise) dengan akses API untuk pengembang. Model GPT-5.1 akan tetap dapat diakses selama tiga bulan ke depan. Jajaran baru ini mencakup GPT-5.2 Instant, yang dirancang sebagai asisten cepat dan efisien untuk tugas sehari-hari dengan nada percakapan yang lebih baik. GPT-5.2 Thinking direkayasa untuk pekerjaan mendalam dan kompleks seperti pemrograman, analisis dokumen panjang, dan logika multi-langkah, dengan klaim kemajuan besar di bidang-bidang ini. Terakhir, GPT-5.2 Pro diposisikan sebagai opsi paling cerdas dan andal untuk pemecahan masalah kompleks berisiko tinggi, dengan kesalahan besar yang lebih sedikit.

Varian Model GPT-5.2 & Fokus:

  • Instant: Dioptimalkan untuk kecepatan dan tugas sehari-hari (pertanyaan, terjemahan, penulisan teknis).
  • Thinking: Dirancang untuk pekerjaan yang mendalam dan kompleks (pemrograman, analisis konteks panjang, logika).
  • Pro: Diposisikan sebagai yang paling andal untuk pemecahan masalah kompleks berisiko tinggi.

Klaim Tolok Ukur Utama:

  • GDPval (44 profesi): 70.9% tugas dilakukan pada atau di atas tingkat ahli manusia.
  • SWE-bench Verified (Pemrograman): Tingkat pemecahan masalah 80% (rekor baru).
  • GPQA Diamond (Sains): Akurasi 93.2% (GPT-5.2 Pro).
  • FrontierMath (Matematika Ahli): 40.3% masalah diselesaikan oleh GPT-5.2 Thinking (rekor baru).

Harga (API): Input: USD 1.75 per juta token Output: USD 14 per juta token

  • Input Tersimpan: Diskon 90%

Performa Tolok Ukur dan Klaim "Ahli Manusia"

OpenAI membuat klaim berani tentang kemampuan GPT-5.2, didukung oleh serangkaian hasil tolok ukur. Perusahaan menyatakan bahwa GPT-5.2 Thinking adalah model pertama mereka yang berkinerja setara atau melebihi tingkat ahli manusia dalam domain tertentu. Pada tolok ukur GPQA Diamond untuk pertanyaan sains tingkat ahli, GPT-5.2 Pro mencapai tingkat akurasi 93,2%. Dalam pemrograman, GPT-5.2 Thinking mencatat rekor baru pada tes SWE-bench Verified, menyelesaikan 80% tugas rekayasa perangkat lunka dunia nyata. Mungkin yang paling mencolok, pada tes kepemilikan (GDPval) yang mencakup pekerjaan berbasis pengetahuan di 44 profesi, kinerja model tersebut menyamai atau melampaui kinerja ahli industri 70,9% dari waktu, sementara beroperasi lebih dari 11 kali lebih cepat dan dengan biaya kurang dari 1%.

Harga, Aksesibilitas, dan Kemitraan dengan Disney

Meskipun performa mentahnya menarik perhatian, pertimbangan praktis seperti biaya dan akses sangat penting. API GPT-5.2 diberi harga 1,75 dolar AS per juta token masukan dan 14 dolar AS per juta token keluaran, dengan diskon 90% untuk masukan yang di-cache. Meskipun ini mewakili kenaikan harga per token dibandingkan GPT-5.1, OpenAI berargumen bahwa efisiensi model yang lebih tinggi mengarah pada total biaya yang lebih rendah untuk mencapai kualitas keluaran yang sama. Dalam perkembangan terpisah yang signifikan, OpenAI juga mengumumkan investasi 1 miliar dolar AS dari Disney. Kemitraan ini akan mengintegrasikan lebih dari 200 karakter berlisensi Disney, Marvel, Pixar, dan Star Wars ke dalam model pembuatan video Sora milik OpenAI, membuka jalan baru untuk hiburan dan pembuatan konten yang dipersonalisasi.

Jalan ke Depan dan Langkah-Langkah Keamanan

Peluncuran GPT-5.2 tampaknya hanyalah awal dari dorongan OpenAI di musim liburan. Altman mengisyaratkan "hadiah Natal kecil" untuk pengguna yang akan datang pada minggu berikutnya, dan rumor industri menyarankan model lain dengan kemampuan gambar dan personalisasi yang ditingkatkan bisa tiba pada Januari 2026. Seiring dengan kemajuan ini, OpenAI menerapkan langkah-langkah keamanan baru. Chief Product Officer Fidji Simo mengonfirmasi peluncuran sistem estimasi usia di beberapa wilayah untuk mengontrol konten dengan lebih baik bagi pengguna di bawah 18 tahun, sebuah pendahulu untuk fitur "mode dewasa" yang direncanakan pada kuartal pertama 2026.