登入 直接訂購 教學視頻

MiniMax開源推理模型M1 稱性價比勝DeepSeek

內地「AI六小虎」之一的稀宇科技(MiniMax)發布新款開源大模型MiniMax-M1,稱其性價比優於DeepSeek。

MiniMax表示,M1是全球首個開源的大規模混合架構的推理模型。據介紹,M1在面向生產力的複雜場景中能力是開源模型中的最好一檔,超過國內的閉源模型,接近海外的最領先模型,同時又有業內最高的性價比。

MiniMax披露,M1的優勢是支持目前業內最高的100萬上下文的輸入,和閉源模型裏面的Google Gemini 2.5 Pro一樣,是DeepSeek R1的8倍,以及業內最長的8萬Token推理輸出。MiniMax在標準基準測試集上的對比顯示,在複雜的軟件工程、工具使用和長上下文任務方面,M1優於DeepSeek-R1和Qwen3-235B等開源模型。

此次M1的最大優勢之一體現在成本上。根據M1大模型分析自身的技術優勢顯示,M1採用低成本訓練,僅用512塊H800 GPU及3周時間便完成強化學習訓練階段,成本為53.47萬美元(約417萬港元),僅為同類模型訓練成本的十分之一。

MiniMax稱,得益於以閃電注意力機制為主的混合架構,從而在計算長的上下文輸入以及深度推理的時候顯著高效。根據推算,在生成長度為10萬tokens的場景下,M1的計算量(FLOPs)為DeepSeek R1的25%,在長文本處理任務中具備顯著優勢。

複雜任務表現接近甚至超越R1

據介紹,M1的核心優勢在於超長上下文處理能力和極低的算力消耗,同時在複雜任務(如工具調用、長文本理解)中表現接近甚至超越DeepSeek R1。其訓練成本僅為R1的十分之一,且提供更靈活的API定價策略,尤其適合需要處理百萬級token的場景(如法律文檔分析、代碼庫理解)。DeepSeek R1則在傳統數學推理和程式設計基準測試中略佔優勢,但受限於上下文長度和計算效率,在長文本任務中明顯落後M1。

價格方面,M1在MiniMax App和Web上支持不限量免費使用。在API方面,第一檔0-32k的輸入長度時,每百萬token輸入為0.8元, 輸出8元;第二檔32k-128k的輸入長度時,每百萬token輸入為1.2元, 輸出16元;第三檔128k-1M輸入長度時,每百萬token輸入為2.4元, 輸出24元。

股票及指數資料由天滙財經有限公司,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。