Google Docs Mendapat Fitur Text-to-Speech Bertenaga AI dengan Integrasi Gemini

Tim Editorial BigGo

Google Docs Mendapat Fitur Text-to-Speech Bertenaga AI dengan Integrasi Gemini

Google telah memperkenalkan fitur audio bertenaga AI yang baru untuk Google Docs yang mengubah dokumen tertulis menjadi suara yang terdengar natural. Peningkatan ini memanfaatkan teknologi Gemini AI untuk memberikan pengalaman text-to-speech yang lebih canggih dibandingkan dengan suara yang dihasilkan komputer tradisional.

Pengalaman Audio yang Ditingkatkan dengan Gemini AI

Fitur baru ini menciptakan versi audio dari dokumen Google Docs menggunakan pemrosesan AI yang canggih. Pengguna dapat mengakses fungsionalitas ini melalui menu Tools, di mana opsi Audio yang baru menghasilkan narasi suara yang realistis dari konten mereka. Sistem memproses dokumen secara otomatis dan memulai pemutaran dengan intonasi dan ritme natural yang lebih baik, meskipun teknologi ini masih menunjukkan keterbatasan sesekali yang khas dari ucapan yang dihasilkan AI.

Kontrol Pemutaran yang Komprehensif dan Kustomisasi

Google telah mengimplementasikan toolbar mengambang yang dapat dipindahkan yang menyediakan kontrol ekstensif atas pengalaman audio. Pengguna dapat menjeda dan melanjutkan pemutaran, menavigasi maju atau mundur melalui dokumen, dan menyesuaikan kecepatan pemutaran mulai dari 0,5x hingga 2x kecepatan normal. Antarmuka memungkinkan pengeditan dokumen yang mulus sambil mempertahankan sinkronisasi audio.

Spesifikasi Fitur:

Rentang kecepatan pemutaran: 0,5x hingga 2,0x
Dukungan bahasa: Hanya bahasa Inggris
Ketersediaan platform: Hanya desktop
Kontrol audio: Putar, jeda, lewati maju/mundur, penyesuaian kecepatan
Kustomisasi: Pemilihan suara, penyisipan tombol audio

Berbagai Opsi Suara untuk Konteks yang Berbeda

Fitur ini menawarkan tujuh profil suara yang berbeda, masing-masing dirancang untuk kasus penggunaan tertentu. Suara Narrator default menyediakan penyampaian yang halus dengan nada sedang, sementara alternatif lainnya termasuk Educator dengan nada ramah dan lebih tinggi, Teacher yang menawarkan narasi yang jelas dengan nada rendah, dan Persuader yang menyampaikan ucapan yang menarik dengan nada rendah. Opsi tambahan termasuk suara Explainer, Coach, dan Motivator, masing-masing dengan karakteristik unik yang cocok untuk berbagai jenis dokumen dan audiens.

Pilihan Suara yang Tersedia:

Narrator: Halus, nada sedang (default)
Educator: Ramah, nada tinggi
Teacher: Jelas, nada rendah
Persuader: Menarik, nada rendah
Explainer: Bersemangat, nada rendah
Coach: Bersemangat, nada tinggi
Motivator: Energik, nada sedang

Kemampuan Berbagi Audio Kolaboratif

Penulis dokumen dapat menyisipkan tombol audio langsung ke dalam Google Docs mereka, memungkinkan pembaca dan kolaborator untuk mengakses fitur text-to-speech tanpa memerlukan izin khusus. Tombol-tombol ini dapat dikustomisasi dalam hal nama, ukuran, dan warna, memberikan fleksibilitas untuk format dokumen yang berbeda dan kebutuhan profesional. Fungsionalitas ini memperluas kegunaan fitur ini di luar penggunaan individu ke skenario kolaborasi tim.

Aplikasi Praktis untuk Menulis dan Mengedit

Fitur audio ini melayani berbagai tujuan untuk pembuat konten dan editor. Penulis dapat mengidentifikasi kesalahan ejaan dan tata bahasa dengan lebih efektif dengan mendengar teks mereka dibacakan, sambil juga mengevaluasi alur dan ritme natural dari prosa mereka. Proses tinjauan auditori ini melengkapi metode pengeditan visual tradisional dan membantu penulis memperbaiki gaya penulisan mereka.

Ketersediaan dan Keterbatasan Platform

Saat ini, fitur ini tersedia secara eksklusif untuk pengguna Google Workspace dengan paket Business Standard, Business Plus, Enterprise Standard, dan Enterprise Plus, serta pelanggan Gemini Education dan Education Premium. Pengguna individu dengan langganan Google AI Pro atau AI Ultra juga memiliki akses. Fungsionalitas ini terbatas pada dokumen berbahasa Inggris dan platform desktop, tanpa dukungan mobile yang diumumkan saat ini.

Berita Terkait

‌

‌
‌

‌

‌
‌

‌