AI Gemini Google Kini Mengubah Foto Menjadi Video dengan Audio yang Dihasilkan AI

Tim Editorial BigGo

AI Gemini Google Kini Mengubah Foto Menjadi Video dengan Audio yang Dihasilkan AI

Google telah memperkenalkan pembaruan signifikan pada platform AI Gemini -nya, yang memungkinkan pengguna mengonversi foto statis menjadi konten video dinamis dengan audio yang tersinkronisasi. Peningkatan ini membawa kemampuan generasi video canggih langsung ke dalam antarmuka Gemini , membuat pembuatan video bertenaga AI lebih mudah diakses oleh para pelanggan.

Didukung oleh Teknologi Model Video Veo 3

Fungsionalitas foto-ke-video yang baru memanfaatkan model video Veo 3 milik Google , yang mewakili kemajuan terbaru perusahaan dalam teknologi generasi video AI. Pengguna dapat mengubah gambar referensi menjadi klip video berdurasi delapan detik lengkap dengan elemen audio yang dihasilkan AI, termasuk suara latar belakang, suara lingkungan, dan ucapan. Fitur ini awalnya didemonstrasikan di konferensi pengembang tahunan Google pada bulan Mei tetapi sebelumnya hanya tersedia melalui Flow , aplikasi pembuatan film mandiri Google .

Spesifikasi Video:

Durasi: maksimal 8 detik
Resolusi: 720p
Format: file MP4 dalam format landscape 16:9
Audio: suara latar belakang yang dihasilkan AI, suara lingkungan, dan ucapan
Watermarking: watermark yang terlihat + watermark digital SynthID yang tidak terlihat

Akses yang Dipermudah Melalui Antarmuka Gemini

Pelanggan Google AI Ultra dan Pro kini dapat mengakses fitur ini langsung melalui antarmuka obrolan Gemini tanpa perlu beralih ke aplikasi terpisah. Pengguna cukup mengklik opsi alat di bilah prompt, memilih video, dan mengunggah foto mereka bersama dengan deskripsi teks yang menentukan gerakan dan elemen audio yang diinginkan. Sistem menghasilkan file MP4 dengan resolusi 720p dalam format lanskap 16:9, dengan Google berjanji bahwa deskripsi audio untuk dialog, efek suara, dan suara ambient akan tersinkronisasi sempurna dengan visual.

Persyaratan Akses:

Berlangganan: Paket Google AI Ultra atau Pro
Ketersediaan: Wilayah tertentu pada tahap awal
Platform: Versi web (diluncurkan terlebih dahulu), aplikasi mobile (akhir minggu ini)
Metode akses: Tools → Video → Upload foto + deskripsi teks

Detail Peluncuran dan Ketersediaan

Fitur ini saat ini sedang diluncurkan ke wilayah-wilayah tertentu, dimulai dengan versi web Gemini dan diperluas ke perangkat mobile sepanjang minggu ini. Penerapan bertahap ini memungkinkan Google untuk memantau kinerja dan umpan balik pengguna saat teknologi ini menjangkau audiens yang lebih luas. Bersamaan dengan itu, Google mengumumkan bahwa Flow akan diluncurkan di 75 negara tambahan, memperluas ekosistem generasi video AI perusahaan secara global.

Keterbatasan Saat Ini dan Masalah Kinerja

Pengujian telah mengungkapkan beberapa keterbatasan dalam implementasi saat ini. Evaluasi Bloomberg menemukan bahwa AI terkadang mengubah wajah orang atau mengubah ras mereka ketika membuat video berbicara dari foto. Prompt yang kompleks, seperti membuat seseorang breakdance, sering menghasilkan hasil yang tidak terduga seperti gerakan melambaikan tangan sederhana alih-alih tindakan yang diminta. Google mengakui masalah-masalah ini, dengan juru bicara menjelaskan bahwa AI tidak diprogram untuk mengubah penampilan dan bahwa teknologi terus berkembang.

Pembatasan Konten:

Tidak boleh ada selebriti, politisi, atau tokoh publik
Tidak boleh ada konten kekerasan atau perundungan
Performa terbaik: Pemandangan alam, gambar, objek
Masalah yang diketahui: Perubahan wajah, perubahan ras dalam video berbicara

Langkah-langkah Keamanan dan Pedoman Konten

Google telah menerapkan pedoman ketat untuk mencegah penyalahgunaan teknologi generasi video. Sistem melarang pembuatan video menggunakan gambar selebriti, politisi, atau tokoh publik lainnya, dan menolak untuk memproduksi konten yang mempromosikan kekerasan atau perundungan. Semua video yang dihasilkan menyertakan tanda air yang terlihat yang menunjukkan generasi AI, ditambah tanda air digital SynthID yang tidak terlihat untuk tujuan identifikasi dan pelacakan tambahan.

Posisi Kompetitif di Pasar Video AI

Pembaruan ini memposisikan Google untuk bersaing lebih efektif dengan pesaing termasuk OpenAI , Runway , Alibaba , dan Kuaishou di pasar generasi video AI yang berkembang pesat. Dengan mengintegrasikan kemampuan pembuatan video langsung ke dalam Gemini , Google mengurangi hambatan bagi pengguna sambil memperluas aplikasi praktis platform AI -nya. Perusahaan menunjukkan bahwa perbaikan pada animasi wajah dan kinerja keseluruhan direncanakan untuk pembaruan masa depan seiring teknologi ini matang.

Berita Terkait

‌

‌
‌

‌

‌
‌

‌