Google telah memperkenalkan fitur audio bertenaga AI yang baru untuk Google Docs yang mengubah dokumen tertulis menjadi suara yang terdengar natural. Peningkatan ini memanfaatkan teknologi Gemini AI untuk memberikan pengalaman text-to-speech yang lebih canggih dibandingkan dengan suara yang dihasilkan komputer tradisional.
Pengalaman Audio yang Ditingkatkan dengan Gemini AI
Fitur baru ini menciptakan versi audio dari dokumen Google Docs menggunakan pemrosesan AI yang canggih. Pengguna dapat mengakses fungsionalitas ini melalui menu Tools, di mana opsi Audio yang baru menghasilkan narasi suara yang realistis dari konten mereka. Sistem memproses dokumen secara otomatis dan memulai pemutaran dengan intonasi dan ritme natural yang lebih baik, meskipun teknologi ini masih menunjukkan keterbatasan sesekali yang khas dari ucapan yang dihasilkan AI.
Kontrol Pemutaran yang Komprehensif dan Kustomisasi
Google telah mengimplementasikan toolbar mengambang yang dapat dipindahkan yang menyediakan kontrol ekstensif atas pengalaman audio. Pengguna dapat menjeda dan melanjutkan pemutaran, menavigasi maju atau mundur melalui dokumen, dan menyesuaikan kecepatan pemutaran mulai dari 0,5x hingga 2x kecepatan normal. Antarmuka memungkinkan pengeditan dokumen yang mulus sambil mempertahankan sinkronisasi audio.
Spesifikasi Fitur:
- Rentang kecepatan pemutaran: 0,5x hingga 2,0x
- Dukungan bahasa: Hanya bahasa Inggris
- Ketersediaan platform: Hanya desktop
- Kontrol audio: Putar, jeda, lewati maju/mundur, penyesuaian kecepatan
- Kustomisasi: Pemilihan suara, penyisipan tombol audio
Berbagai Opsi Suara untuk Konteks yang Berbeda
Fitur ini menawarkan tujuh profil suara yang berbeda, masing-masing dirancang untuk kasus penggunaan tertentu. Suara Narrator default menyediakan penyampaian yang halus dengan nada sedang, sementara alternatif lainnya termasuk Educator dengan nada ramah dan lebih tinggi, Teacher yang menawarkan narasi yang jelas dengan nada rendah, dan Persuader yang menyampaikan ucapan yang menarik dengan nada rendah. Opsi tambahan termasuk suara Explainer, Coach, dan Motivator, masing-masing dengan karakteristik unik yang cocok untuk berbagai jenis dokumen dan audiens.
Pilihan Suara yang Tersedia:
- Narrator: Halus, nada sedang (default)
- Educator: Ramah, nada tinggi
- Teacher: Jelas, nada rendah
- Persuader: Menarik, nada rendah
- Explainer: Bersemangat, nada rendah
- Coach: Bersemangat, nada tinggi
- Motivator: Energik, nada sedang
Kemampuan Berbagi Audio Kolaboratif
Penulis dokumen dapat menyisipkan tombol audio langsung ke dalam Google Docs mereka, memungkinkan pembaca dan kolaborator untuk mengakses fitur text-to-speech tanpa memerlukan izin khusus. Tombol-tombol ini dapat dikustomisasi dalam hal nama, ukuran, dan warna, memberikan fleksibilitas untuk format dokumen yang berbeda dan kebutuhan profesional. Fungsionalitas ini memperluas kegunaan fitur ini di luar penggunaan individu ke skenario kolaborasi tim.
Aplikasi Praktis untuk Menulis dan Mengedit
Fitur audio ini melayani berbagai tujuan untuk pembuat konten dan editor. Penulis dapat mengidentifikasi kesalahan ejaan dan tata bahasa dengan lebih efektif dengan mendengar teks mereka dibacakan, sambil juga mengevaluasi alur dan ritme natural dari prosa mereka. Proses tinjauan auditori ini melengkapi metode pengeditan visual tradisional dan membantu penulis memperbaiki gaya penulisan mereka.
Ketersediaan dan Keterbatasan Platform
Saat ini, fitur ini tersedia secara eksklusif untuk pengguna Google Workspace dengan paket Business Standard, Business Plus, Enterprise Standard, dan Enterprise Plus, serta pelanggan Gemini Education dan Education Premium. Pengguna individu dengan langganan Google AI Pro atau AI Ultra juga memiliki akses. Fungsionalitas ini terbatas pada dokumen berbahasa Inggris dan platform desktop, tanpa dukungan mobile yang diumumkan saat ini.