SenseTime Meluncurkan Platform Kecerdasan Terwujud "Wu Neng" dengan Teknologi Model Dunia Canggih

Tim Editorial BigGo
SenseTime Meluncurkan Platform Kecerdasan Terwujud "Wu Neng" dengan Teknologi Model Dunia Canggih

Raksasa AI China SenseTime telah membuat langkah signifikan di sektor kecerdasan terwujud dengan memperkenalkan platform Wu Neng yang revolusioner di konferensi WAIC 2025. Platform komprehensif ini merepresentasikan kemajuan besar dalam menjembatani kesenjangan antara kecerdasan buatan dan kemampuan interaksi dunia nyata untuk robot dan perangkat cerdas.

CEO Xu Li mempresentasikan platform Wu Neng , menandai lompatan signifikan dalam kecerdasan yang terwujud di konferensi WAIC 2025
CEO Xu Li mempresentasikan platform Wu Neng , menandai lompatan signifikan dalam kecerdasan yang terwujud di konferensi WAIC 2025

Teknologi Inti dan Arsitektur

Platform kecerdasan terwujud Wu Neng dibangun di sekitar model dunia terwujud milik SenseTime, yang berfungsi sebagai mesin inti yang menggerakkan kemampuan sistem. Arsitektur canggih ini memanfaatkan infrastruktur komputasi skala besar SenseTime untuk menyediakan dukungan komputasi baik di sisi edge maupun cloud. Platform ini dirancang khusus untuk meningkatkan robot dan perangkat cerdas dengan kemampuan persepsi yang kuat, sistem navigasi visual, dan kemampuan interaksi multimodal, mendorong terminal cerdas menuju tingkat otonomi dan kecerdasan yang lebih tinggi.

Kemampuan Platform

  • Persepsi dan pemahaman terhadap lingkungan dunia nyata
  • Sistem navigasi visual
  • Kemampuan interaksi multimodal
  • Dukungan komputasi sisi edge dan sisi cloud
  • Embedding langsung ke dalam chip sisi edge

Integrasi Perangkat Keras yang Serbaguna dan Deployment

Salah satu fitur platform yang paling menarik adalah kemampuan adaptasinya yang luar biasa di berbagai konfigurasi perangkat keras. Platform Wu Neng dapat terintegrasi dengan mulus dengan berbagai jenis sistem robotik dan perangkat terminal, memungkinkan mereka mencapai persepsi dan pemahaman komprehensif terhadap dunia di sekitar mereka. Fleksibilitas sistem meluas ke opsi deployment-nya, karena mendukung embedding langsung ke dalam chip sisi edge, menyediakan adaptabilitas skenario yang kuat yang membuatnya cocok untuk aplikasi dunia nyata yang beragam.

Demonstrasi Langsung dan Interaksi Natural

Selama presentasi konferensi, Chairman dan CEO SenseTime Xu Li menunjukkan kemampuan platform melalui demonstrasi langsung yang mengesankan. Robot humanoid yang dilengkapi dengan mesin dunia terwujud memberikan presentasi yang natural dan menarik tentang Leci Chang'an, mendemonstrasikan kemampuan komunikasi yang sangat mirip manusia. Robot tersebut menunjukkan kemampuan presentasi yang canggih, termasuk membalik halaman secara otomatis, menjawab berbagai pertanyaan dari audiens, dan memberikan ringkasan berkala sepanjang presentasi. Demonstrasi ini menyoroti kemampuan platform untuk memfasilitasi interaksi yang natural, humoris, dan sesuai konteks.

Contoh Demonstrasi

  • Robot humanoid mempresentasikan PPT " Chang'an's Lychees "
  • Kemampuan membalik halaman otomatis dan tanya jawab
  • Perintah bahasa alami: "cari sesuatu di rak di area dapur"
  • Navigasi kompleks: "masuk ke ruang hiburan, belok kanan, lalu buka pintu ke halaman"
Demonstrasi model dunia yang terwujud yang menampilkan bagaimana robot dapat mengikuti instruksi bahasa alami untuk melakukan tugas
Demonstrasi model dunia yang terwujud yang menampilkan bagaimana robot dapat mengikuti instruksi bahasa alami untuk melakukan tugas

Generasi Video Canggih dan Pemahaman Spasial

Model dunia terwujud meluas melampaui kemampuan interaksi dasar untuk mencakup fitur generasi video yang canggih. Sistem dapat membuat video multi-perspektif sambil mempertahankan konsistensi temporal dan spasial yang sangat baik, memungkinkan mesin untuk memahami, menghasilkan, dan mengedit representasi dunia nyata. Kemampuan ini membuka kemungkinan menarik untuk interaksi dunia tingkat spasial, membuat skenario seperti bermain game balap dalam lingkungan jalan yang sebenarnya secara teknis dapat dilakukan.

Fitur Teknis

  • Generasi video multi-perspektif dengan konsistensi temporal dan spasial
  • Konstruksi dunia 4D untuk orang, objek, dan pemandangan
  • Pemrosesan perintah bahasa alami
  • Generasi otonom untuk posisi, pergerakan, dan instruksi
  • Kemampuan interaksi dan pengeditan dunia nyata

Konstruksi Dunia 4D dan Kontrol Intuitif

Model dunia terwujud SenseTime mendemonstrasikan kemampuan luar biasa dalam membangun representasi 4D lingkungan dunia nyata yang mencakup orang, objek, dan pemandangan. Sistem merespons prompt bahasa natural yang sederhana dengan akurasi dan kecanggihan yang mengesankan. Pengguna dapat mengeluarkan perintah langsung seperti temukan sesuatu di rak di area dapur atau masuk ke ruang hiburan, belok kanan, lalu buka pintu ke halaman, dan model dunia terwujud secara otonom menghasilkan posisi yang tepat, struktur kerangka gerakan, dan instruksi eksekusi.

Visi untuk Transformasi Industri

Menurut CEO Xu Li, tujuan utama SenseTime dengan platform kecerdasan terwujud Wu Neng meluas melampaui pencapaian teknologi mereka sendiri. Perusahaan bertujuan untuk memberdayakan berbagai perusahaan kecerdasan terwujud di berbagai industri, membantu mereka mewujudkan aspirasi interaksi yang bermakna dengan dunia nyata. Pendekatan kolaboratif ini menunjukkan niat SenseTime untuk menetapkan platform sebagai teknologi fundamental yang dapat mempercepat inovasi di seluruh ekosistem AI terwujud yang lebih luas.

Peluncuran Wu Neng merepresentasikan tonggak sejarah yang signifikan dalam evolusi kecerdasan buatan terwujud, berpotensi mempercepat pengembangan sistem robotik yang lebih canggih dan mampu yang dapat terintegrasi dengan mulus ke dalam lingkungan dan alur kerja manusia.