Google terus melanjutkan pengembangan pesat Gemini, AI andalannya, dengan pembaruan fitur Oktober yang substansial yang meningkatkan kemampuannya di seluruh produktivitas, hiburan, dan aksesibilitas. Pembaruan terbaru ini membawa peningkatan signifikan pada rendering teknis, pembuatan presentasi, dan bahkan memperkenalkan alat yang kuat dan gratis untuk transkripsi audio, menandai langkah lain dalam membuat utilitas AI canggih lebih tersedia secara luas.
Peningkatan Rendering LaTeX untuk Rumus Kompleks
Peningkatan utama bagi pengguna teknis adalah rendering LaTeX yang ditingkatkan dalam Gemini di web. Peningkatan ini memungkinkan kompatibilitas yang lebih baik dengan alat Canvas Google, memungkinkan pengguna untuk menyalin rumus matematika kompleks dengan mulus, mengeditnya langsung dalam lingkungan Canvas, dan mengunduh hasil akhir sebagai PDF. Ini merupakan keuntungan besar bagi siswa, peneliti, dan insinyur yang secara rutin bekerja dengan dokumentasi ilmiah, karena merampingkan proses mengintegrasikan notasi matematika yang presis ke dalam alur kerja digital mereka.
Dari Perintah AI ke Presentasi yang Dipoles
Google juga menjembatani kesenjangan antara AI-nya dan rangkaian produktivitasnya dengan pembaruan besar pada Canvas, mendekatkannya ke fungsionalitas Google Slides. Pengguna kini dapat dengan mudah memberikan Gemini sebuah topik atau mengunggah materi sumber, dan AI akan menghasilkan satu set slide lengkap yang bertema, lengkap dengan gambar yang relevan. Untuk pelanggan paket Google AI Pro, fungsi ekspor baru memungkinkan presentasi yang dihasilkan AI ini dipindahkan langsung ke aplikasi Google Slides untuk penyempurnaan lebih lanjut, sebuah fitur yang akan diluncurkan ke pengguna gratis dalam beberapa minggu mendatang.
Transkripsi Audio Gratis untuk Semua Orang
Dalam langkah yang menantang layanan berbayar, Gemini kini menawarkan fitur transkripsi audio gratis. Pengguna dapat mengunggah file audio dalam format MP3, AAC, atau WAV, dan Gemini akan dengan cepat mengubah ucapan menjadi teks. Utilitas ini mendukung hingga 10 file sekaligus, asalkan panjang gabungannya tidak melebihi 10 menit. Di luar transkripsi sederhana, AI dapat diminta untuk membersihkan teks dengan menghapus kata-kata pengisi seperti 'um' dan 'ah', merangkum poin-poin kunci, atau menemukan informasi spesifik dalam audio, menjadikannya alat yang serbaguna bagi jurnalis, siswa, dan profesional.
AI yang Lebih Cerdas dan Integrasi Hiburan yang Lebih Luas
Model AI yang mendasarinya juga menjadi lebih cerdas. Model Gemini 2.5 Flash telah menerima peningkatan untuk lebih baik dalam menangani topik kompleks, kini mampu memberikan instruksi langkah-demi-langkah yang terperinci dan memberikan respons yang lebih terorganisir dan mudah dipahami. Di bidang hiburan, Gemini untuk Google TV yang telah lama ditunggu telah memulai peluncurannya, dimulai dengan perangkat seri TCL QM9K. Fitur ini memungkinkan interaksi suara alami untuk mendapatkan ringkasan acara, rekomendasi hiburan, dan konten edukasi untuk anak-anak melalui YouTube, dengan rencana untuk memperluas ke lebih banyak perangkat seperti Google TV Streamer tahun ini.
Jadwal Peluncuran Gemini untuk Google TV:
| Perangkat | Ketersediaan |
|---|---|
| TCL QM9K Series | Tersedia Sekarang |
| Google TV Streamer | Akhir Tahun Ini |
| Walmart Onn. 4K Pro | Akhir Tahun Ini |
| 2025 Hisense U7/U8 Series | Akhir Tahun Ini |
Meningkatkan Realisme dalam Video yang Dihasilkan AI
Bagi para profesional kreatif, Google menyoroti pembaruan Veo 3.1 untuk model pembuatan videonya, yang dapat diakses melalui aplikasi Gemini dan Flow. Iterasi ini berfokus pada peningkatan realisme, menawarkan tekstur yang lebih baik, soundscape yang lebih kaya, dan memberi pengguna kontrol naratif yang lebih granular untuk menghidupkan konsep imajinatif mereka dengan kesetiaan yang lebih besar dari sebelumnya.
