Nano Banana Pro Google Bertujuan Atasi Masalah Teks dan Kepercayaan dalam AI

Tim Editorial BigGo
Nano Banana Pro Google Bertujuan Atasi Masalah Teks dan Kepercayaan dalam AI

Google telah meluncurkan Nano Banana Pro, peningkatan signifikan untuk teknologi pembuatan gambar AI-nya yang dibangun di atas model Gemini 3 Pro. Rilis baru ini langsung menangani dua tantangan paling persisten dalam ruang gambar AI: merender teks yang terbaca dan menetapkan transparansi konten. Model ini kini diluncurkan di seluruh ekosistem Google, mulai dari aplikasi Gemini yang ditujukan untuk konsumen hingga alat profesional seperti Google Slides dan Ads, menandakan dorongan besar untuk membuat visual yang dihasilkan AI layak untuk kreasi kasual maupun aplikasi bisnis serius.

Lompatan ke Depan dalam Perenderan Teks dan Pengetahuan Dunia Nyata

Peningkatan yang paling langsung terlihat dalam Nano Banana Pro adalah kemampuannya untuk menghasilkan teks yang akurat dan terbaca di dalam gambar. Ini telah menjadi kelemahan terkenal bagi generator gambar AI, yang sering kali menghasilkan huruf yang kacau dan kata-kata yang tidak masuk akal. Google mengklaim model ini memberikan "perenderan teks yang sempurna," mendukung berbagai bahasa dan bahkan penerjemahan. Tes awal menunjukkan bahwa model ini dapat membuat infografis yang koheren, melabeli diagram dengan benar, dan menghasilkan materi pemasaran dengan kalimat lengkap yang dapat dibaca. Kemampuan ini didukung oleh penalaran yang ditingkatkan dari Gemini 3 Pro, yang memungkinkan model untuk menarik informasi real-time dari Google Search untuk membuat visual yang kaya konteks seperti infografis berbasis data atau resep dengan instruksi yang akurat.

Peningkatan Fitur Utama di Nano Banana Pro:

  • Model Dasar: Dibangun di atas Gemini 3 Pro (berbanding Nano Banana original yang menggunakan Gemini 2.5 Flash).
  • Penyajian Teks: Pembuatan teks dalam gambar yang sempurna dan mendukung multi-bahasa.
  • Pencampuran Gambar: Menggabungkan elemen dari hingga 14 gambar masukan.
  • Konsistensi Orang: Mempertahankan kemiripan hingga 5 orang di berbagai hasil generasi.
  • Kontrol Kreatif: Pengeditan tersetempat, penyesuaian sudut kamera, kontrol fokus, color grading.
  • Transparansi: Penandaan air SynthID dengan alat verifikasi publik di aplikasi Gemini.

Kontrol Kreatif yang Ditingkatkan dan Integrasi Profesional

Bagi para profesional, Nano Banana Pro menawarkan rangkaian kontrol kreatif baru yang melampaui generasi gambar sederhana dari perintah. Pengguna kini dapat melakukan pengeditan yang terlokalisasi, menyempurnakan bagian tertentu dari gambar, dan menyesuaikan elemen seperti sudut kamera, fokus, penilaian warna, dan pencahayaan adegan. Model ini juga dapat memadukan elemen dari hingga 14 gambar masukan yang berbeda sambil mempertahankan konsistensi dan kemiripan hingga lima orang, suatu keuntungan untuk membuat konten bermerek. Integrasinya ke dalam rangkaian profesional Google—termasuk Google Ads, Workspace, Slides, dan Vids—menggarisbawahi audiens targetnya: bisnis yang mencari cara hemat biaya untuk menghasilkan aset pemasaran dan materi presentasi yang berkualitas.

Standar Baru untuk Transparansi AI

Mungkin fitur yang paling visioner adalah alat transparansi yang ditingkatkan dari Google. Siapa pun kini dapat mengunggah gambar ke aplikasi Gemini dan menanyakan apakah gambar itu dihasilkan oleh Google AI. Ini didukung oleh SynthID, teknologi watermarking digital Google yang menanamkan sinyal tak kasat mata ke dalam media yang dihasilkan AI. Sementara model lain menggunakan watermarking, Google membuat verifikasi dapat diakses langsung oleh konsumen. Dalam langkah signifikan bagi pengguna profesional, pelanggan Google AI Ultra akan memiliki watermark "Gemini sparkle" yang terlihat dihapus dari kreasi mereka, mengakui kebutuhan akan aset yang bersih dan berkualitas profesional sambil mempertahankan tanda tangan digital yang mendasar dan dapat diverifikasi.

Ketersediaan dan Model Akses

Nano Banana Pro tersedia secara global di aplikasi Gemini ketika pengguna memilih model 'Thinking'. Pengguna tingkat gratis menerima kuota harian terbatas sebelum dialihkan kembali ke model Nano Banana asli. Pelanggan berbayar, termasuk pengguna Google AI Plus, Pro, dan Ultra, mendapatkan batas generasi yang lebih tinggi. Bagi pengembang dan perusahaan, model ini dapat diakses melalui Gemini API, Google AI Studio, dan akan segera tersedia di Vertex AI. Model akses berjenjang ini memungkinkan Google melayani semua orang, mulai dari pengguna kasual yang bereksperimen dengan AI hingga bisnis besar yang menskalakan pembuatan konten.

Tingkat Akses untuk Nano Banana Pro:

  • Pengguna Gratis: Kuota harian terbatas di aplikasi Gemini; watermark terlihat.
  • Pelanggan Google AI Plus/Pro/Ultra: Batas pembuatan konten yang lebih tinggi.
  • AI Pro & Ultra (AS): Akses melalui Mode AI di aplikasi Gemini.
  • Pelanggan Google AI Ultra: Tanpa watermark yang terlihat; akses di Flow (alat pembuatan film AI).
  • Pengembang/Perusahaan: Akses melalui Gemini API, Google AI Studio, Vertex AI.
  • Workspace/Google Ads: Terintegrasi untuk pelanggan bisnis.

Verdict tentang Gambar AI Tingkat Korporat

Tes langsung awal mengungkapkan alat dengan kemampuan yang luar biasa tetapi keterbatasan yang familier. Meskipun perenderan teks jauh lebih baik, model ini masih bisa kesulitan dengan tugas kompleks seperti pelabelan gambar yang akurat. Dorongan untuk adopsi profesional jelas terlihat, dan peningkatan resolusi serta kontrol yang lebih baik tentu akan menarik bagi bisnis. Namun, hasilnya masih dapat membawa estetika khas, terkadang tidak alami, dari grafik yang dihasilkan AI. Seiring teknologi ini tertanam dalam alat tempat kerja, era komunikasi korporat berbantuan AI sudah benar-benar tiba, menjanjikan efisiensi tetapi juga memunculkan pertanyaan tentang homogenisasi media visual. Nano Banana Pro dari Google mewakili langkah substansial dalam mematangkan generasi gambar AI dari sekadar hal baru menjadi alat praktis.