Google Diam-diam Menaikkan Harga Gemini 2.5 Flash Hingga 4 Kali Lipat Sambil Mengumumkan Model Flash-Lite Baru

Tim Editorial BigGo

Google Diam-diam Menaikkan Harga Gemini 2.5 Flash Hingga 4 Kali Lipat Sambil Mengumumkan Model Flash-Lite Baru

Google telah membuat model Gemini 2.5 Flash dan Pro tersedia secara umum sambil memperkenalkan varian Flash-Lite baru. Namun, pengumuman ini telah memicu diskusi signifikan di komunitas developer karena kenaikan harga yang substansial yang tidak ditonjolkan dalam postingan blog resmi.

Kenaikan Harga Tersembunyi Mengejutkan Developer

Transisi dari preview ke rilis stabil membawa perubahan harga yang dramatis untuk Gemini 2.5 Flash. Biaya input naik dua kali lipat dari 0,15 dolar AS menjadi 0,30 dolar AS per juta token, sementara harga output melonjak dari 0,60 dolar AS menjadi 2,50 dolar AS per juta token untuk mode non-thinking - peningkatan 4 kali lipat. Komunitas telah mengkritik Google karena meremehkan perubahan ini, dengan postingan blog hanya menyebutkan pengurangan dari 3,50 dolar AS menjadi 2,50 dolar AS untuk output mode thinking.

Berita sebenarnya adalah bahwa output non-thinking sekarang 4 kali lebih mahal, yang tentu saja mereka hindari untuk disebutkan dalam blog, hanya membandingkan harga thinking.

Strategi harga ini mempengaruhi developer yang membangun aplikasi selama periode preview, terutama mereka yang menggunakan mode non-thinking untuk tugas-tugas yang sensitif terhadap kecepatan seperti voice AI atau aplikasi real-time.

Perubahan Harga Gemini 2.5 Flash

Metrik	Harga Preview	Harga Stabil Baru	Kenaikan
Token input	$0.15/juta	$0.30/juta	2x
Output (non-thinking)	$0.60/juta	$2.50/juta	4.2x
Output (thinking)	$3.50/juta	$2.50/juta	0.7x (penurunan)
Token audio	$1.00/juta	$1.00/juta	Tidak ada perubahan

Flash-Lite Muncul sebagai Alternatif Budget

Google memperkenalkan Gemini 2.5 Flash-Lite sebagai opsi paling hemat biaya, diposisikan untuk bersaing dengan model 2.0 Flash yang lebih lama. Varian baru ini mempertahankan context window 1 juta token dan kemampuan multimodal sambil menawarkan waktu respons yang lebih cepat, sering kali di bawah 400ms. Namun, pengujian awal menunjukkan bahwa mungkin tidak dapat menyamai performa model Flash penuh untuk tugas-tugas kompleks.

Biaya pemrosesan audio juga meningkat signifikan di semua lini, dengan Flash-Lite mengenakan tarif 0,50 dolar AS per juta token dibandingkan dengan 2.0 Flash-Lite sebelumnya yang 0,075 dolar AS - mewakili lonjakan harga 6,3 kali lipat.

Fitur Utama Gemini 2.5 Flash-Lite

Context Window: 1 juta token
Response Time: Biasanya di bawah 400ms, bisa serendah 200ms
Capabilities: Input multimodal, integrasi Google Search, eksekusi kode
Thinking Mode: Tersedia dengan anggaran yang dapat disesuaikan
Positioning: Model paling hemat biaya dalam keluarga 2.5

Reaksi Komunitas Terbagi Soal Kualitas Model

Umpan balik developer tentang pembaruan terbaru Gemini menunjukkan hasil yang beragam. Sementara beberapa pengguna memuji peningkatan performa coding dan context window yang besar, yang lain melaporkan degradasi kualitas dibandingkan dengan versi preview sebelumnya. Beberapa developer telah mencatat masalah dengan respons yang bertele-tele, komentar berlebihan dalam kode yang dihasilkan, dan performa yang tidak konsisten.

Sistem pembatasan rate juga mendapat kritik, dengan beberapa pengguna tidak dapat mencapai tier pengeluaran yang lebih tinggi karena batas permintaan yang ketat, memaksa mereka kembali ke kompetitor seperti OpenAI meskipun lebih menyukai kemampuan teknis Gemini.

Perbandingan Harga Pemrosesan Audio

Model	Harga per Juta Token
Gemini 2.0 Flash-Lite	$0.075
Gemini 2.5 Flash-Lite	$0.50
Kenaikan Harga	6.3x

Strategi Harga Mencerminkan Kematangan Pasar

Kenaikan harga sejalan dengan tren industri yang lebih luas ketika perusahaan AI beralih dari akuisisi pelanggan yang agresif ke model bisnis yang berkelanjutan. Harga murah Google di awal membantu membangun kehadiran pasar, tetapi perusahaan sekarang tampak cukup percaya diri untuk mengenakan tarif pasar. Pergeseran ini mencerminkan lanskap AI yang semakin matang di mana penyedia menyeimbangkan peningkatan performa dengan tuntutan profitabilitas.

Perubahan ini menyoroti tantangan berkelanjutan bagi developer yang membangun pada model preview, di mana stabilitas harga tidak dijamin sampai ketersediaan umum. Seiring pasar AI terus berkembang, perusahaan harus menimbang manfaat kemampuan mutakhir terhadap risiko biaya dan ketentuan yang berfluktuasi.

Referensi: We're expanding our Gemini 2.5 family of models

Berita Terkait

‌

‌
‌

‌

‌
‌

‌