人工智能技術日新月異的當下,上海AI獨角獸MiniMax稀宇極智在10月最后一周掀起了一場AI技術的“全家桶”發布熱潮。
繼開源文本大模型M2震動全球AI圈,MiniMax接連發布視頻模型Hailuo 2.3、語音模型Speech 2.6和音樂模型Music 2.0,標志著中國AI企業在全模態技術領域的全面突破。
中國開源模型首次躋身全球前五
10月27日,新一代文本大模型MiniMax M2正式發布和開源,這款僅有10B激活參數(總參230B)的輕量級模型在全球權威測評榜單Artificial Analysis (AA)上創造了歷史性突破——總分沖入全球前五、開源第一,成功躋身全球文本模型第一梯隊。
這一成績的意義非同尋常。長期以來,全球大模型的“S級”梯隊幾乎被硅谷巨頭們壟斷,而M2的出現首次為這一梯隊注入了強勁的中國開源力量。更令人矚目的是M2的顛覆性定價策略。該模型綜合成本低至約0.53美元/百萬Token,不及Claude 4.5 Sonnet的8%,推理速度是其近兩倍。這種“高智能,更實惠”的理念正在從根本上改寫AI領域的“算力游戲”規則。
“M2專為編碼與智能體任務深度優化,完美契合了新興多智能體工作流對高效協同與快速響應的需求。”MiniMax相關負責人表示。在模型性能、推理速度、推理成本的“不可能三角”中,MiniMax幾乎做到了最佳優化。而這些能力對于企業內部的自動化支持、研發和數據分析等場景部署越來越重要。
值得注意的是,文本模型M2上線僅5天,在API整合平臺OpenRouter上的實時調用token量已經排到了全球第四、國產第一,超過DeepSeek和Qwen;在編程場景中全球第三。M2在Coding,Agentic,Deep Research等場景顯著提升,作為第一個國產模型真正在復雜的Coding、Agent場景中進入硅谷主流視野,每天的調用量token仍在迅速增長。

多模態家族持續更新
緊隨M2的發布,10月28日最新視頻生成模型海螺2.3(Hailuo 2.3)發布。這款在Hailuo 02模型基礎上實現全面技術升級的新版本,在動態表現力、風格化呈現以及人物表演細膩度方面取得了顯著突破。新版本模型再次刷新了全球視頻模型效果成本紀錄,在提升性能表現的同時保持了Hailuo 02的原有定價水平,實現了“加量不加價”的承諾。
在語音技術領域,MiniMax發布的Speech 2.6模型同樣引人注目。該模型專門針對聲音智能體(Voice Agent)場景進行了深度優化,將首包響應時間壓到了250毫秒,達到了語音賽道的絕對頭部水平。與傳統語音指令識別不同,Voice Agent不只是簡單將語音轉成文字,而是具備完整的交互能力,幾乎所有需要“用說話代替打字”的場景,都依賴Voice Agent來承接需求、理解意圖并給出反饋。
在音樂生成領域,MiniMax Music 2.0模型實現了真正的躍升。該模型不僅能夠精準捕捉與還原人聲的細膩情緒和器樂的動態張力,更像一位“會唱歌的制作人”,懂節奏,也懂情緒。Music 2.0在人聲表現方面實現了重大突破,音色無限接近真實人聲,能夠駕馭多種唱法和情感風格。
中國AI展現“算法自信”
MiniMax此次“AI全家桶”發布的意義超越了技術本身,它折射出中國AI在全球科技版圖中的角色變遷。能在全模態自研層面都做到模型領先,具有綜合研發積累的公司,目前有OpenAI、Google等國際巨頭,而MiniMax是唯一一家亞洲公司,也是其中唯一一家創業公司。從Meta對MiniMax底層CISPO算法的“致敬”,到今天MiniMax全模態模型以頂級性能和顛覆性成本向全球開源,中國AI正在完成從應用模仿的“中國制造”到算法原創的“中國創造”的戰略轉變。
強大的基礎大模型是推動AI與實體經濟深度融合的關鍵。MiniMax的全模態“全家桶”更像是一份中國方案,用性能比肩頂尖水平、成本實現普惠、算法勇于原創的獨特AI發展路徑,向世界提交答卷。
可以看到,中國AI正以一種前所未有的自信姿態,從全球AI競賽的“跟跑者”,加速變為關鍵賽道的“領跑者”。隨著海螺2.3、Speech 2.6、Music 2.0的正式發布,AI視頻、語音、音樂生成技術將迎來新的發展階段,為數字內容創作產業注入新的活力。
MiniMax相關負責人表示:“AI技術正在改變越來越多人的工作和創作方式,我們希望成為創作者的全能助手和創新先鋒,讓每一個靈感都能超越形式的限制,生長成各行各業的真實生產力。”