自主程式碼開發
M3 能獨立重現研究論文,連續運行近 12 小時以生成提交記錄與實驗圖表。
CUDA 核心優化
可在 NVIDIA Hopper GPU 上優化 FP8 GEMM 等運算密集型操作,在零人工干預下實現顯著加速。
長距離代理任務
100 萬 Token 的上下文視窗使其能處理代理工作流程與長影片理解所需的擴展序列。
自動化資料管線
M3 能自主完成僅預訓練基礎模型的資料合成、訓練、評估與迭代的完整流程。
多模態分析
解析論文中的圖表與公式,整合文字與視覺資訊以達成深度理解。
長距離程式碼編寫
擴展上下文支援需要在單一視窗中維護大型程式碼庫或日誌的複雜程式碼任務。
100 萬上下文 MSA 架構
MiniMax 稀疏注意力(MSA)架構支援最高 100 萬 Token 的上下文視窗,並保證至少 51.2 萬 Token,可處理長距離任務。
原生多模態
模型從零步驟開始即以多模態資料訓練,實現文字與視覺語義空間的深度對齊。
自主任務分解
M3 能將複雜任務拆解為子步驟並獨立執行,如論文重現與核心優化所示。
工具調用
可進行工具調用(例如在核心優化過程中調用 1,959 次工具)以與外部系統互動。
多步驟推理
模型跨多個步驟進行序列推理,支援自動化工作流程。
高基準測試表現
在 BrowseComp 上,M3 得分 83.5,超越 Opus 4.7(79.3),展現強大的自主瀏覽與資訊檢索能力。
長時穩定性
可在無人工干預下連續運行長時間(例如論文重現 12 小時、核心優化 24 小時)。
程式碼與代理能力
M3 在軟體工程、終端執行等基準測試中達到世界領先水準。
MiniMax M3 是 MiniMax 推出的開源權重模型,專為編碼、代理任務與多模態理解設計,採用 MSA 架構,支援 100 萬詞元的上下文視窗。
分类:大模型平台
訪問連結:https://www.minimax.io/models/text/m3
标签:開放權重模型、程式碼AI、多模態理解、大上下文視窗、代理任務