MiniMax Meluncurkan Model Reasoning M1 untuk Menantang DeepSeek dengan Konteks 1 Juta Token dan Biaya Pelatihan Ultra-Rendah

Tim Editorial BigGo
MiniMax Meluncurkan Model Reasoning M1 untuk Menantang DeepSeek dengan Konteks 1 Juta Token dan Biaya Pelatihan Ultra-Rendah

Startup AI Tiongkok MiniMax telah memasuki arena model reasoning yang kompetitif dengan tantangan berani kepada pemimpin industri DeepSeek. Pengumuman terbaru perusahaan ini menandai tonggak penting dalam persaingan berkelanjutan di antara enam perusahaan AI besar Tiongkok untuk mengembangkan kemampuan reasoning canggih yang dapat bersaing dengan para pemimpin global.

Terobosan Revolusioner dalam Panjang Konteks dan Efisiensi

Model M1 MiniMax memperkenalkan kemampuan terobosan dengan dukungan untuk input konteks 1 juta token, menyamai Google Gemini 2.5 Pro dan merepresentasikan peningkatan 8 kali lipat dari kapasitas DeepSeek R1. Model ini juga mendukung hingga 80.000 token untuk output reasoning, menetapkan standar industri baru untuk pemrosesan konteks panjang. Pencapaian ini berasal dari mekanisme Lightning Attention milik MiniMax, pendekatan baru untuk menghitung matriks attention yang secara signifikan mengurangi overhead komputasi selama fase pelatihan dan inferensi.

Spesifikasi Utama MiniMax M1

  • Input Konteks: 1.000.000 token (8x DeepSeek R1)
  • Output Penalaran: 80.000 token
  • Biaya Pelatihan: USD 534.700 (512 GPU H800, 3 minggu)
  • Arsitektur: Mixed MoE dengan mekanisme Lightning Attention
  • Algoritma: Pembelajaran penguatan CISPO (konvergensi 2x lebih cepat dari DAPO)

Pelatihan Hemat Biaya Melalui Inovasi Teknis

Perusahaan mencapai efisiensi biaya yang luar biasa dalam pengembangan model, menyelesaikan seluruh fase reinforcement learning menggunakan hanya 512 GPU H800 selama tiga minggu dengan biaya sewa hanya 534.700 dolar Amerika. Ini merepresentasikan pengurangan sepuluh kali lipat dari proyeksi awal, mendemonstrasikan efektivitas inovasi teknis MiniMax. Terobosan ini datang melalui algoritma reinforcement learning CISPO yang baru dikembangkan, yang mengoptimalkan bobot importance sampling daripada pembaruan token tradisional, menghasilkan kecepatan konvergensi dua kali lebih cepat dari pendekatan pesaing termasuk algoritma DAPO terbaru ByteDance.

Performa Kompetitif di Seluruh Benchmark Industri

Pengujian komprehensif di 17 dataset evaluasi mainstream mengungkapkan posisi kompetitif yang kuat dari M1 di pasar. Model ini mendemonstrasikan performa yang sebanding dengan DeepSeek R1 dan Qwen3 dalam berbagai tes benchmark, sambil mendekati kemampuan model O3 OpenAI. Yang patut dicatat adalah performa superior M1 dalam skenario penggunaan tool agent melalui evaluasi TAU-bench, di mana ia mengungguli Google Gemini 2.5 Pro meskipun sedikit tertinggal dalam tugas pemahaman konteks panjang umum.

Tolok Ukur Performa

  • 17 dataset evaluasi mainstream telah diuji
  • Performa sebanding dengan DeepSeek R1 dan Qwen3
  • Mendekati kemampuan OpenAI O3
  • Mengungguli Gemini 2.5 Pro dalam TAU-bench (penggunaan tool agent)
  • Sedikit tertinggal dari Gemini 2.5 Pro dalam pemahaman konteks panjang

Strategi Harga untuk Penetrasi Pasar

MiniMax telah menerapkan struktur harga bertingkat yang dirancang untuk memaksimalkan aksesibilitas sambil mempertahankan keunggulan kompetitif. Untuk panjang konteks 0-32k token, perusahaan mengenakan tarif 0,8 yuan Tiongkok per juta token input dan 8 yuan Tiongkok per juta token output. Rentang 32k-128k berharga 1,2 yuan Tiongkok untuk input dan 16 yuan Tiongkok untuk output per juta token, sementara rentang maksimum 128k-1M dihargai 2,4 yuan Tiongkok untuk input dan 24 yuan Tiongkok untuk output. Strategi harga ini memposisikan M1 sebagai lebih hemat biaya daripada DeepSeek R1 di dua tingkat pertama, sambil menawarkan kemampuan unik di tingkat tertinggi yang tidak dapat ditandingi DeepSeek.

Perbandingan Harga (per juta token)

Panjang Konteks Harga Input (CNY) Harga Output (CNY)
0-32k 0.8 8
32k-128k 1.2 16
128k-1M 2.4 24

Catatan: Dua tingkatan pertama menawarkan performa harga yang lebih baik dibandingkan DeepSeek R1; tingkatan tertinggi tidak tersedia di DeepSeek

Ekosistem Produk yang Lebih Luas dan Ambisi IPO

Peluncuran M1 hanya merepresentasikan satu komponen dari rangkaian pengumuman produk lima hari komprehensif MiniMax, yang juga mencakup model generasi video Hailuo 02 dan platform MiniMax Agent. Peluncuran produk agresif ini datang saat perusahaan dilaporkan mempersiapkan IPO potensial di Hong Kong, mengikuti langkah pesaing Zhipu AI yang sebelumnya mengajukan listing publik. Pengamat industri mencatat bahwa MiniMax menghadapi tantangan signifikan dalam memenuhi persyaratan pendapatan IPO, dengan pendapatan saat ini terutama bergantung pada aplikasi roleplay karakter Talkie yang sukses dan platform video AI Hailuo yang lebih baru.

Posisi Pasar dan Prospek Masa Depan

Posisi strategis MiniMax mencerminkan persaingan intens di antara startup AI Tiongkok untuk mempertahankan relevansi setelah disrupsi pasar DeepSeek. Fokus perusahaan pada kemampuan multimodal, khususnya dalam generasi video di mana Hailuo AI telah mencapai kepemimpinan global dalam peringkat produk generasi video, memberikan pendekatan yang berbeda dibandingkan pesaing yang murni fokus pada teks. Namun, kesuksesan M1 dan produk terkait pada akhirnya akan menentukan apakah MiniMax dapat mempertahankan posisinya di antara perusahaan AI Tiongkok tingkat atas sambil membangun fondasi pendapatan yang diperlukan untuk masuk pasar publik yang sukses.