Terobosan Flex:ai Huawei Gandakan Efisiensi Komputasi AI, Tantang Pendekatan Berbasis Perangkat Keras

Tim Editorial BigGo
Terobosan Flex:ai Huawei Gandakan Efisiensi Komputasi AI, Tantang Pendekatan Berbasis Perangkat Keras

Seiring industri AI global bergulat dengan tingginya permintaan komputasi dan alokasi sumber daya yang tidak efisien, sebuah solusi berbasis perangkat lunak baru muncul yang dapat membentuk ulang fundamental cara kita memanfaatkan perangkat keras yang ada. Huawei, berkolaborasi dengan institusi akademik terkemuka, telah meluncurkan Flex:ai, sebuah teknologi container open-source yang dirancang untuk mengatasi masalah umum pemborosan daya komputasi. Langkah strategis ini menggeser lanskap persaingan dari sekadar membangun chip yang lebih kuat menjadi mengoptimalkan bagaimana setiap unit kemampuan pemrosesan yang ada digunakan.

Pivot Strategis dari Perangkat Keras ke Perangkat Lunak

Industri AI menghadapi tantangan paradoks: sementara permintaan daya komputasi melonjak, tingkat utilisasi GPU dan NPU saat ini hanya bertahan di angka 30-40%. Flex:ai Huawei merepresentasikan pergeseran fundamental dalam mengatasi ketidakefisienan ini, melampaui "perlombaan senjata perangkat keras" tradisional untuk fokus pada optimisasi perangkat lunak. Teknologi container ini bertindak sebagai "super-dispatcher" canggih yang dapat mengelola dan mengoordinasi secara cerdas berbagai sumber daya komputasi dari berbagai vendor, termasuk GPU Nvidia, chip Ascend Huawei sendiri, dan prosesor pihak ketiga lainnya. Dengan membuat lapisan manajemen terpadu, sistem ini memastikan bahwa aset komputasi yang mahal tidak lagi menganggur sementara proses lain menunggu sumber daya yang tersedia.

Peningkatan Kinerja

  • Rata-rata Peningkatan Utilisasi: Peningkatan 30% dalam penggunaan sumber daya komputasi
  • Alokasi Sumber Daya: Memungkinkan beberapa beban kerja AI berjalan secara bersamaan pada perangkat keras tunggal
  • Efisiensi Infrastruktur: Berpotensi mengurangi kebutuhan server hingga sepertiga untuk output yang setara
  • Cakupan Aplikasi: Efektif untuk kebutuhan komputasi model kecil (pelatihan/inferensi) maupun model besar

Tiga Terobosan Teknis Inti

Efektivitas teknologi ini berasal dari tiga pendekatan inovatif yang dikembangkan melalui kemitraan akademik. Melalui kolaborasi dengan Shanghai Jiao Tong University, Huawei menciptakan kerangka XPU pooling yang memungkinkan kartu GPU atau NPU tunggal dipartisi menjadi beberapa unit komputasi virtual dengan presisi luar biasa hingga 10% peningkatan. Pendekatan "satu kartu menjadi banyak" ini memungkinkan beberapa beban kerja AI berjalan bersamaan pada perangkat keras yang secara tradisional didedikasikan untuk satu tugas tunggal. Sementara itu, kemitraan dengan Xiamen University menghasilkan teknologi virtualisasi cross-node yang mengagregasi sumber daya komputasi menganggur di seluruh kluster, membentuk "kolam komputasi" bersama yang dapat diakses bahkan oleh server tujuan umum yang tidak memiliki prosesor AI khusus. Akhirnya, pengembangan bersama dengan Xi'an Jiaotong University menghasilkan pengatur cerdas Hi Scheduler, yang secara otomatis mencocokkan beban kerja dengan sumber daya yang sesuai berdasarkan prioritas, kebutuhan komputasi, dan beban sistem saat ini.

Fitur Teknis Utama Flex:ai

  • Kerangka Kerja XPU Pooling: Mempartisi kartu GPU/NPU tunggal menjadi unit virtual dengan granularitas 10%
  • Virtualisasi Lintas Node: Mengagregasi sumber daya komputasi menganggur di seluruh kluster server
  • Hi Scheduler: Pengatur cerdas yang mencocokkan beban kerja dengan sumber daya optimal
  • Kompatibilitas Platform: Bekerja dengan sistem orkestrasi container Kubernetes
  • Dukungan Perangkat Keras: Kompatibel dengan GPU Nvidia, NPU Huawei Ascend, dan prosesor pihak ketiga

Mengubah Ekonomi Industri dan Aksesibilitas

Implikasi praktis dari lompatan efisiensi ini cukup substansial bagi bisnis yang menerapkan solusi AI. Organisasi berpotensi mencapai output komputasi yang sama dengan investasi perangkat keras yang berkurang signifikan – yang sebelumnya membutuhkan tiga server sekarang mungkin dapat diselesaikan dengan dua. Efek demokratisasi ini menurunkan hambatan masuk untuk pengembangan AI, khususnya untuk usaha kecil dan menengah yang telah kesulitan dengan biaya infrastruktur komputasi yang prohibitive. Pendekatan vendor-agnostic teknologi ini juga memberikan bisnis fleksibilitas yang lebih besar dalam keputusan pengadaan perangkat keras, mengurangi ketergantungan pada satu produsen chip dan menciptakan pasar yang lebih kompetitif.

Kemitraan Pengembangan

  • Shanghai Jiao Tong University: Kerangka kerja pooling XPU dan teknologi partisi sumber daya
  • Xiamen University: Kemampuan virtualisasi lintas node dan akses sumber daya jarak jauh
  • Xi'an Jiaotong University: Sistem pencocokan beban kerja-sumber daya cerdas Hi Scheduler

Era Komputasi Terdefinisi Perangkat Lunak yang Muncul

Inisiatif Huawei menandakan transisi industri yang lebih luas menuju komputasi terdefinisi perangkat lunak, di mana efisiensi sistem menjadi sama pentingnya dengan kinerja perangkat keras mentah. Evolusi ini mencerminkan pergeseran industri smartphone dari kompetisi spesifikasi teknis menjadi optimisasi pengalaman pengguna. Seiring perangkat keras komputasi mencapai dataran tinggi kinerja tertentu, frontier kemajuan berikutnya terletak pada manajemen sumber daya dan koordinasi sistem yang lebih cerdas. Untuk pengembangan kekuatan produktif berkualitas baru, pendekatan ini menawarkan jalur untuk meningkatkan produktivitas faktor total melalui optimisasi cerdas daripada sekadar akumulasi sumber daya.

Strategi Open-Source dan Implikasi Masa Depan

Dengan membuat Flex:ai open-source, Huawei bertujuan untuk mempercepat adopsi dan standardisasi industri secara luas terhadap praktik komputasi efisien. Pendekatan kolaboratif ini mendorong inovasi global sambil membangun Huawei sebagai pemimpin pemikiran dalam efisiensi komputasi. Waktunya sangat signifikan karena bisnis di seluruh dunia menghadapi tekanan yang meningkat untuk menyeimbangkan ambisi AI dengan tujuan keberlanjutan dan kendala biaya. Seiring teknologi ini matang, kita dapat mengharapkan untuk melihat model bisnis baru muncul dalam operasi pusat data dan pasar penyewaan komputasi, di mana penyedia layanan dapat menawarkan lebih banyak kapasitas tanpa investasi perangkat keras tambahan.