YouTube telah diam-diam menjalankan eksperimen yang membuat penonton merasa seperti menonton konten melalui cermin funhouse. Platform ini telah menggunakan AI untuk meningkatkan kualitas video yang diunggah ke YouTube Shorts, tetapi hasilnya menyebabkan keresahan luas di kalangan pengguna yang menggambarkan rekaman yang telah diproses tersebut sebagai sangat mengganggu.
Kontroversi ini terungkap ketika video konser Will Smith memicu tuduhan menggunakan kerumunan palsu yang dihasilkan AI. Meskipun kerumunannya ternyata asli, video tersebut telah diproses melalui beberapa lapisan peningkatan AI yang membuatnya terlihat artifisial dan mengganggu.
![]() |
---|
Komunikasi resmi YouTube mengenai eksperimen mereka dengan peningkatan pemrosesan video AI |
Lapisan Ganda Pemrosesan AI
Rekaman konser Will Smith mengalami dua perlakuan AI yang terpisah. Pertama, tim Smith menggunakan alat AI untuk mengonversi foto diam dari penonton konser asli menjadi klip video pendek untuk konten promosi mereka. Teknik ini, yang dikenal sebagai generasi gambar-ke-video, mengambil foto statis dan menciptakan ilusi gerakan.
Lapisan kedua berasal dari YouTube sendiri. Platform ini telah bereksperimen dengan pasca-pemrosesan otomatis pada video YouTube Shorts tertentu, menggunakan apa yang mereka sebut teknologi pembelajaran mesin tradisional untuk mengurangi noise dan blur. Namun, hasilnya jauh dari tradisional.
Generasi gambar-ke-video: Teknologi AI yang menciptakan klip video bergerak dari foto diam dengan memprediksi dan menghasilkan frame perantara
Pemrosesan Video Konser Will Smith:
- Layer 1: Tim Smith menggunakan model AI image-to-video untuk menganimasikan foto-foto statis penonton
- Layer 2: Post-processing otomatis YouTube pada Shorts
- Rekaman asli: Konser nyata di festival-festival Eropa ( Fiestas Lenders Festival , Paleo Festival , Ronquières Festival )
- Hasil: Konten autentik terlihat palsu karena peningkatan AI berlapis
Efek Uncanny Valley
Pengguna melaporkan reaksi fisik terhadap video yang diproses, dengan beberapa mengalami mual dan disorientasi. Pemrosesan AI menciptakan apa yang banyak orang gambarkan sebagai efek uncanny valley - di mana sesuatu terlihat hampir nyata tetapi terasa sangat salah.
Saya merasakan perasaan tidak nyaman yang serius seolah-olah saya sedang dalam pengaruh psikedelik dan tidak bisa mempercayai persepsi saya
Masalah ini menjadi sangat jelas dalam rekaman konser, di mana AI mencoba memperbaiki bidikan yang sengaja blur atau artistik. Dalam satu contoh, video konser David Bowie diproses hingga musisi ikonik tersebut menjadi hampir tidak dapat dikenali, dengan AI pada dasarnya menciptakan wajah baru ketika tidak dapat menginterpretasikan rekaman asli dengan jelas.
Uncanny valley: Perasaan tidak nyaman yang dialami orang ketika menemui sesuatu yang tampak hampir, tetapi tidak sepenuhnya, manusiawi atau nyata
![]() |
---|
Penggemar yang terlibat secara emosional dalam momen tersebut, merefleksikan efek aneh dari pemrosesan video AI |
Masalah TV Smoothing Lagi
Situasi ini mencerminkan pertempuran yang sedang berlangsung melawan motion smoothing pada televisi modern - fitur yang menginterpolasi frame untuk membuat konten tampak lebih halus tetapi sering merusak maksud artistik pembuat film. Banyak pengguna melaporkan bahwa pemrosesan AI membuat konten profesional terlihat murah dan artifisial, mirip dengan bagaimana sinetron tampak berbeda dari film karena frame rate yang lebih tinggi.
Teknologi ini tampaknya lebih dirancang untuk membuat demonstrasi penjualan terlihat mengesankan daripada benar-benar meningkatkan pengalaman menonton. Sama seperti TV di toko menggunakan motion smoothing untuk tampak lebih tajam dari pesaing, pemrosesan YouTube mungkin ditujukan untuk membuat konten tampak lebih halus di layar mobile kecil.
Detail Pemrosesan AI YouTube:
- Hanya diterapkan pada YouTube Shorts, bukan video reguler
- Menggunakan "machine learning tradisional" untuk pengurangan noise dan blur
- Juru bicara Google menjelaskan ini "bukan generative AI" tetapi computational photography
- Pemrosesan terjadi secara otomatis pada video tertentu tanpa persetujuan pengunggah
- Menghasilkan rekaman yang terlihat artifisial dan berbeda dari unggahan asli di platform lain
![]() |
---|
Penggemar yang mengekspresikan dukungan mereka selama konser, di tengah perdebatan tentang peningkatan buatan dalam konten video |
Tren yang Mengkhawatirkan untuk Realitas
Di luar masalah visual langsung, perkembangan ini menimbulkan pertanyaan yang lebih dalam tentang hubungan kita dengan konten autentik. Ketika pemrosesan AI menjadi lebih umum dan lebih sulit dideteksi, garis antara konten nyata dan artifisial terus kabur. Ini sangat mengkhawatirkan untuk rekaman historis, konten berita, dan materi dokumenter di mana akurasi sangat penting.
Situasi ini menyoroti masalah yang lebih luas dalam industri teknologi: dorongan untuk mengimplementasikan solusi AI bahkan ketika konsumen tidak memintanya. Dari chatbot yang tidak diinginkan hingga peningkatan gambar otomatis, perusahaan tampaknya bertekad untuk menyisipkan AI ke dalam setiap aspek kehidupan digital, sering membuat pengalaman menjadi lebih buruk daripada lebih baik.
Eksperimen YouTube mewakili contoh terbaru dari teknologi yang diterapkan bukan karena meningkatkan pengalaman pengguna, tetapi karena menunjukkan kemampuan mutakhir. Ketika AI menjadi lebih canggih, membedakan antara konten autentik dan yang diproses hanya akan menjadi lebih menantang, berpotensi merusak kepercayaan pada media digital secara keseluruhan.
Referensi: Will Smith's concert crowds are real, but AI is blurring the lines