Xiaomi Perkenalkan MiMo-V2-Flash: Model AI Berkecepatan Tinggi dan Biaya Rendah untuk Menggerakkan Ekosistemnya

Tim Editorial BigGo
Xiaomi Perkenalkan MiMo-V2-Flash: Model AI Berkecepatan Tinggi dan Biaya Rendah untuk Menggerakkan Ekosistemnya

Dalam langkah signifikan untuk memperkuat posisinya di lanskap kecerdasan buatan yang kompetitif, raksasa teknologi China Xiaomi secara resmi meluncurkan dan membuka sumber model bahasa besar terbarunya, MiMo-V2-Flash. Pengumuman yang dibuat pada Konferensi Mitra "Ekosistem Lengkap Manusia-Mobil-Rumah" Xiaomi 2025 pada 17 Desember ini menandai dorongan strategis untuk menanamkan kemampuan AI canggih di seluruh portofolio perangkat kerasnya yang luas, mulai dari ponsel pintar hingga rumah pintar dan kendaraan listrik. Memimpin upaya ini adalah kepala baru tim model MiMo Xiaomi, peneliti AI ternama Luo Fuli, yang debut publiknya menegaskan komitmen serius perusahaan dalam mengembangkan teknologi AI fondasional.

MiMo-V2-Flash: Dirancang untuk Kecepatan dan Efisiensi

MiMo-V2-Flash adalah model Mixture of Experts (MoE) dengan total jumlah parameter 309 miliar, di mana 15 miliar di antaranya aktif selama inferensi. Pilihan arsitektur ini adalah inti dari filosofi desainnya, yang mengutamakan kinerja berkecepatan tinggi dan efektivitas biaya daripada sekadar skala besar. Tim Xiaomi yang dipimpin Luo Fuli berfokus pada pengoptimalan model khususnya sebagai basis untuk agen AI, menekankan kemampuan seperti pembuatan kode dan penggunaan alat yang penting untuk sistem interaktif. Perusahaan mengklaim model ini mencapai kecepatan inferensi yang luar biasa, menghasilkan hingga 150 token per detik, yang 2 hingga 2,6 kali lebih cepat dibandingkan beberapa model sebanding. Kecepatan ini dicapai melalui inovasi teknis seperti akselerasi inferensi MTP tiga lapis untuk verifikasi token paralel dan mekanisme perhatian hibrida yang menggabungkan jendela geser dan perhatian global.

Spesifikasi Kunci MiMo-V2-Flash

  • Tipe Model: Mixture of Experts (MoE)
  • Total Parameter: 309 Miliar (309B)
  • Parameter Aktif: 15 Miliar (15B)
  • Kecepatan Inferensi yang Diklaim: ~150 token/detik
  • Klaim Kecepatan vs. Tolok Ukur: 2.0x - 2.6x lebih cepat daripada model sebanding yang tidak ditentukan.
  • Harga API: Input: CNY 0.7 / 1 juta token; Output: CNY 2.1 / 1 juta token.
  • Skor Tolok Ukur Terkemuka: 73.4% pada SWE-Bench Multilingual.
  • Fokus Utama: Pembuatan kode, penggunaan alat, dan berfungsi sebagai basis untuk agen AI.

Klaim Kinerja dan Tolok Ukur

Dalam hal kinerja mentah, Xiaomi memposisikan MiMo-V2-Flash sebagai pesaing tingkat atas di antara model sumber terbuka. Luo Fuli menyatakan bahwa dalam tolok ukur kemampuan kode dan agen, model ini berada dalam dua besar global untuk penawaran sumber terbuka. Secara spesifik, dilaporkan mencetak skor 73,4% pada tolok ukur rekayasa perangkat lunak multibahasa SWE-Bench, sebuah hasil yang diklaim Xiaomi melampaui beberapa model sumber tertutup terkemuka. Perusahaan memberikan perbandingan langsung, mencatat bahwa meskipun kinerjanya setara atau melebihi model seperti DeepSeek-V3.2 dan Kimi K2-Thinking dalam banyak evaluasi, hal itu dilakukan hanya dengan separuh hingga sepertiga dari parameter mereka. Pendekatan "lebih kecil tetapi lebih pintar" ini adalah bagian kunci dari narasi Xiaomi, yang mengisyaratkan pergeseran dari hukum penskalaan murni menuju pelatihan model yang lebih efisien dan terspesialisasi.

Perbandingan Kinerja yang Dilaporkan

  • Vs. Claude Sonnet 4.5: Diklaim biaya inferensi adalah 2.5% dari Claude; kecepatan 2x lebih cepat.
  • Vs. DeepSeek-V3.2 / Kimi K2-Thinking: Mengklaim kinerja yang setara atau lebih unggul pada banyak tolok ukur dengan 1/2 hingga 1/3 dari jumlah parameter.
  • Posisi: Peringkat sebagai model sumber terbuka global Top 1-2 untuk kemampuan kode dan agen menurut Xiaomi.

Strategi Harga yang Disruptif

Mungkin aspek paling agresif dari peluncuran ini adalah harga modelnya. Xiaomi telah menetapkan biaya API untuk MiMo-V2-Flash sebesar CNY 0,7 per juta token untuk input dan CNY 2,1 per juta token untuk output. Perusahaan membingkai ini sebagai keunggulan kompetitif utama, menegaskan bahwa biaya inferensi hanya 2,5% dari model patokan seperti Claude Sonnet 4.5. Strategi penetapan harga yang agresif ini menggema buku pedoman historis Xiaomi dalam mengganggu pasar dengan produk bernilai tinggi dan biaya rendah, yang kini diterapkan pada sektor inferensi AI awan. Tujuannya jelas untuk menurunkan hambatan masuk bagi pengembang dan bisnis yang ingin membangun sistem AI agen, berpotensi mempercepat adopsi dalam ekosistem Xiaomi sendiri dan di luarnya.

Visi Strategis: AI sebagai "Otak" untuk Ekosistem Xiaomi

Peluncuran ini bukanlah peristiwa yang terisolasi, tetapi komponen inti dari strategi "Ekosistem Lengkap Manusia-Mobil-Rumah" Xiaomi yang lebih luas. Presentasi Luo Fuli menekankan bahwa generasi AI berikutnya seharusnya bukan sekadar "simulator bahasa" tetapi agen cerdas yang memahami dan berinteraksi dengan dunia fisik. Visi ini selaras langsung dengan kebutuhan Xiaomi. Model ini dimaksudkan untuk menjadi fondasi AI untuk meningkatkan asisten suaranya "Xiao Ai", HyperOS, dan yang kritis, sistem mengemudi otonomnya. Dengan mengembangkan model dasar internal yang efisien, Xiaomi bertujuan untuk menciptakan pengalaman AI yang kohesif di ratusan juta perangkat terhubungnya, dari ponsel dan peralatan hingga kendaraan listrik Xiaomi SU7 dan YU7.

Kepemimpinan dan Peta Jalan Masa Depan

Sorotan pada Luo Fuli, yang sering dijuluki "AI genius少女" (anak ajaib) di media China, menyoroti investasi Xiaomi dalam bakat terbaik untuk mencapai ambisi AI-nya. Setelah bergabung dengan Xiaomi baru lebih dari sebulan lalu setelah masa jabatan yang terkenal di Damo Academy Alibaba dan perusahaan induk DeepSeek, debut cepatnya menandakan prioritas tinggi proyek ini. Xiaomi telah mengalokasikan sumber daya yang substansial untuk upaya ini, dengan rencana untuk berinvestasi lebih dari CNY 200 miliar dalam R&D selama lima tahun ke depan, sebagian besar didedikasikan untuk AI. MiMo-V2-Flash adalah yang terbaru dalam serangkaian rilis model pada 2025, mengikuti model lain yang berfokus pada visi dan kecerdasan berwujud, yang menunjukkan langkah pengembangan yang cepat dan terstruktur.

Konteks: Rilis Model AI Xiaomi 2025

  • April 2025: Membuka sumber seri MiMo-7B (versi dasar, instruksi-tertuning, RL).
  • Mei 2025: Merilis MiMo-VL-7B, sebuah model bahasa-visi multimodal.
  • November 2025: Memperkenalkan MiMo-Embodied, sebuah model untuk mengemudi otonom dan robotika.
  • Desember 2025: Meluncurkan andalan MiMo-V2-Flash, berfokus pada AI agen dan efisiensi.

Kesimpulan: Taruhan Terhitung pada Masa Depan AI

Peluncuran MiMo-V2-Flash oleh Xiaomi mewakili taruhan strategis yang terhitung dan multifaset. Ini adalah demonstrasi teknis dari desain model yang efisien, permainan pasar dengan harga yang disruptif, dan langkah fondasional untuk seluruh ekosistem produknya. Meskipun kinerja model di dunia nyata dalam berbagai aplikasi masih harus divalidasi secara menyeluruh oleh komunitas pengembang, spesifikasi dan tolok ukurnya menyajikan kasus yang menarik. Bagi Xiaomi, kesuksesan pada akhirnya akan diukur bukan oleh posisi papan peringkat, tetapi oleh seberapa mulus dan kuat "otak" AI ini dapat diintegrasikan ke dalam pengalaman sehari-hari penggunanya, menggerakkan segala sesuatu mulai dari ponsel yang lebih pintar hingga mobil yang lebih aman dan cerdas. Perlombaan untuk mendefinisikan era baru AI konsumen telah dimulai, dan Xiaomi baru saja memperkenalkan pesaing baru yang kuat.