Pandemi mendorong banyak musisi dan profesional audio untuk mencari solusi kreatif bagi panggilan jarak jauh berkualitas tinggi. Yang dimulai sebagai permintaan sederhana dari seorang teman untuk menggunakan mikrofon eksternal dan gitar di Zoom telah memicu percakapan yang lebih luas tentang mengapa kualitas audio masih sangat buruk di tahun 2025, meskipun kita memiliki teknologi untuk melakukan jauh lebih baik.
Pendekatan Hardware vs Software Membagi Komunitas
Sementara beberapa penggemar audio merangkul perutean perangkat lunak yang kompleks melalui DAW dan driver audio virtual, yang lain berpendapat bahwa solusi hardware menawarkan hasil yang lebih sederhana dan lebih andal. Kubu hardware menunjuk pada preamp mikrofon khusus, channel strip, dan audio interface sebagai alternatif tanpa latensi yang bekerja di berbagai sistem operasi tanpa perlu perangkat agregat atau perutean virtual.
Pendekatan perangkat lunak, meskipun lebih kompleks, menawarkan fleksibilitas yang lebih besar dengan plugin untuk pengurangan noise dan kompresi. Namun, ini memerlukan pengaturan yang cermat dari driver audio virtual dan perutean yang tepat untuk menghindari feedback loop.
Catatan: DAW adalah singkatan dari Digital Audio Workstation - perangkat lunak yang digunakan untuk merekam dan mencampur audio
Komponen Pengaturan Perangkat Keras:
- Mikrofon: Shure SM57
- USB Audio Interface: Behringer UMC202HD
- Perangkat Lunak DAW: Reaper
- Virtual Audio Driver: Blackhole (versi 16ch dan 2ch)
- Perangkat Keras Tambahan: DBX286 mic preamp, TC Electronic multiband compressor
Masalah Kualitas Audio Bluetooth
Titik masalah yang signifikan muncul di sekitar keterbatasan audio nirkabel. Meskipun perangkat modern mampu menghasilkan ratusan megabit per detik melalui WiFi, kualitas audio Bluetooth hampir tidak mengalami peningkatan dalam dua dekade. Komunitas mencatat bahwa mendorong hanya 2,3 megabit per detik untuk audio stereo berkualitas tinggi ditambah mikrofon mono seharusnya mudah di tahun 2025, namun sebagian besar konsumen terjebak dengan codec yang terkompresi dan berkualitas rendah.
Telepon analog di tahun 80-an terdengar lebih baik daripada hampir semua hal yang kemungkinan akan berinteraksi dengan konsumen biasa hari ini
Frustrasi ini meluas melampaui keterbatasan teknis hingga ke praktik bisnis, di mana pengembang codec menciptakan hambatan paten untuk mencegah alternatif gratis berkualitas tinggi mendapatkan adopsi.
Perbandingan Kualitas Audio:
- Bluetooth modern: audio terkompresi ~16kHz
- Telepon analog (1980an): Kualitas yang dirasakan lebih tinggi dibanding solusi konsumen saat ini
- Target digital berkualitas tinggi: 48kHz, stereo 16-bit (kebutuhan bandwidth 2,3 Mbps)
- Layanan profesional: Audio lossless dengan latensi di bawah 50ms untuk kolaborasi real-time
Layanan Khusus Mengisi Kesenjangan
Layanan audio profesional seperti Cleanfeed telah muncul untuk mengatasi keterbatasan ini, menawarkan audio fidelitas tinggi dan latensi rendah yang dirancang khusus untuk musisi dan podcaster. Platform ini melewati keterbatasan pemrosesan audio dari alat konferensi video umum, meskipun mereka mengharuskan semua peserta menggunakan layanan khusus yang sama.
Tantangan teknis menjadi sangat jelas untuk kolaborasi musik langsung, di mana latensi lebih dari 50 milidetik membuat bermain secara real-time hampir tidak mungkin.
Kesimpulan
Diskusi kualitas audio mengungkapkan frustrasi yang lebih luas dengan keadaan komunikasi digital saat ini. Sementara teknologi untuk panggilan yang sangat jernih sudah ada, kombinasi protokol lama, pembatasan paten, dan prioritas pengalaman pengguna telah membuat banyak profesional audio membangun solusi alternatif yang rumit. Baik melalui perutean perangkat lunak yang kompleks atau pengaturan hardware khusus, komunitas terus mendorong solusi yang lebih baik di era di mana kualitas audio yang buruk terasa semakin ketinggalan zaman.
Referensi: Telephone colophon: Or, how I overengineered my call audio