Microsoft telah meluncurkan Agent Mode baru untuk Excel dan Word, menjanjikan transformasi cara pengguna membuat spreadsheet dan dokumen kompleks melalui bantuan AI. Namun, metrik kinerja dan respons komunitas mengungkap kekhawatiran signifikan tentang keandalan dan implementasi praktis.
Ketersediaan Fitur
- Agent Mode ( Excel / Word ): Tersedia hari ini dalam program Frontier
- Dukungan Platform: Versi web pada awalnya, dukungan desktop akan segera hadir
- Kelayakan: Pelanggan Microsoft 365 Copilot atau pelanggan Microsoft 365 Personal/Family
- Office Agent: Tersedia di AS saja melalui program Frontier
Akurasi Masih di Bawah Kinerja Manusia
Agent Mode baru di Excel mencapai tingkat akurasi 57,2% pada SpreadsheetBench, sebuah benchmark standar untuk mengevaluasi kemampuan AI spreadsheet. Meskipun ini menempatkannya di depan kompetitor seperti Shortcut.ai dan agen Excel ChatGPT, namun masih tertinggal jauh dari akurasi manusia sebesar 71,3%. Kesenjangan ini menimbulkan pertanyaan apakah teknologi tersebut sudah siap untuk aplikasi bisnis kritis di mana presisi sangat penting.
Kekhawatiran akurasi menjadi lebih mendesak ketika mempertimbangkan peran Excel dalam menangani data bisnis vital di seluruh dunia. Microsoft telah mengakui tantangan ini dengan menerapkan loop validasi dan memastikan bahwa sheet yang dihasilkan AI tetap dapat diaudit, diperbarui, dan diverifikasi.
Perbandingan Akurasi Agent Mode Excel
- Microsoft Agent Mode: 57,2%
- Performa Manusia: 71,3%
- Shortcut.ai: Di bawah 57,2%
- ChatGPT Excel Agent: Di bawah 57,2%
- Claude Files Opus 4.1: Di bawah 57,2%
Skeptisisme Komunitas tentang Vibe Working
Para profesional teknologi telah mengekspresikan reaksi beragam terhadap konsep vibe working Microsoft. Beberapa memandang pendekatan ini terlalu sederhana untuk tugas analitis yang kompleks. Komunitas telah menarik paralel dengan ekspektasi yang tidak realistis, membandingkan prompt seperti lakukan analisis lengkap & temukan wawasan untuk saya dengan kemampuan komputer fiktif Hollywood perjelas dan perbesar.
Berapa tingkat pengembalian menurut model keuangan kita? Biarkan saya vibe jawabannya untuk Anda. Sebentar.
Sentimen ini mencerminkan kekhawatiran yang lebih luas tentang apakah AI dapat menangani persyaratan bernuansa dari pemodelan keuangan dan analisis data yang diandalkan para profesional setiap hari.
![]() |
---|
' Agent Mode ' baru Microsoft meminta pengguna untuk analisis data tingkat lanjut sambil menimbulkan kekhawatiran tentang efektivitasnya |
Tantangan Implementasi Teknis
Pengguna telah menyoroti masalah fundamental dengan mengintegrasikan AI ke dalam kerangka kerja Excel yang ada. Tidak seperti sistem kontrol versi yang menyediakan pelacakan perubahan yang jelas, Excel kekurangan kemampuan diff yang kuat, sehingga sulit untuk memverifikasi modifikasi yang dihasilkan AI. Sifat saling terhubung dari data spreadsheet berarti bahwa kesalahan AI dapat menyebar melalui berbagai kalkulasi dan referensi.
Beberapa anggota komunitas menyarankan bahwa integrasi AI yang efektif akan memerlukan reimajinasi lengkap arsitektur Excel. Mereka membayangkan fitur seperti pohon dependensi terstruktur dan manajemen state yang lebih baik, mirip dengan perangkat lunak CAD 3D, yang akan membuat intervensi AI lebih transparan dan dapat dikontrol.
Fitur-fitur baru saat ini tersedia melalui program Frontier Microsoft untuk pelanggan Copilot dan subscriber Personal/Family, awalnya terbatas pada versi web dengan dukungan desktop direncanakan untuk rilis selanjutnya.
Referensi: Microsoft launches 'vibe working' in Excel and Word