MiniMax M3

MiniMax M3 是什麼？

MiniMax M3 是一個開放權重模型，將程式碼編寫、代理任務與多模態理解整合於單一系統中。它基於專有的 MiniMax 稀疏注意力（MSA）架構，支援最高 100 萬 Token 的上下文視窗，並保證至少 51.2 萬 Token。使用者可利用 M3 進行自主任務分解、工具調用與多步驟推理，使其成為 AI 程式碼助手與自動化工作流程的可靠基礎。這是首個在程式碼編寫、百萬 Token 上下文與原生多模態能力上達到前沿水準的開放權重模型。

Application scenarios

自主程式碼開發
M3 能獨立重現研究論文，連續運行近 12 小時以生成提交記錄與實驗圖表。
CUDA 核心優化
可在 NVIDIA Hopper GPU 上優化 FP8 GEMM 等運算密集型操作，在零人工干預下實現顯著加速。
長距離代理任務
100 萬 Token 的上下文視窗使其能處理代理工作流程與長影片理解所需的擴展序列。
自動化資料管線
M3 能自主完成僅預訓練基礎模型的資料合成、訓練、評估與迭代的完整流程。
多模態分析
解析論文中的圖表與公式，整合文字與視覺資訊以達成深度理解。
長距離程式碼編寫
擴展上下文支援需要在單一視窗中維護大型程式碼庫或日誌的複雜程式碼任務。

Core Features

100 萬上下文 MSA 架構
MiniMax 稀疏注意力（MSA）架構支援最高 100 萬 Token 的上下文視窗，並保證至少 51.2 萬 Token，可處理長距離任務。
原生多模態
模型從零步驟開始即以多模態資料訓練，實現文字與視覺語義空間的深度對齊。
自主任務分解
M3 能將複雜任務拆解為子步驟並獨立執行，如論文重現與核心優化所示。
工具調用
可進行工具調用（例如在核心優化過程中調用 1,959 次工具）以與外部系統互動。
多步驟推理
模型跨多個步驟進行序列推理，支援自動化工作流程。
高基準測試表現
在 BrowseComp 上，M3 得分 83.5，超越 Opus 4.7（79.3），展現強大的自主瀏覽與資訊檢索能力。
長時穩定性
可在無人工干預下連續運行長時間（例如論文重現 12 小時、核心優化 24 小時）。
程式碼與代理能力
M3 在軟體工程、終端執行等基準測試中達到世界領先水準。

目標使用者

MiniMax M3 專為從事程式碼助手、自動化工作流程與代理系統的 AI 研究人員、軟體工程師與開發者設計。它也適用於需要多模態理解能力的團隊，例如論文分析、影片理解或資料管線自動化等任務。

如何使用 MiniMax M3？

使用者可透過 MiniMax API 存取 M3，或直接在 MiniMax Code 環境中試用。網站提供「API 與 Token 方案」選項以及「在 MiniMax Code 中試用」按鈕。如需詳細使用方式，使用者應閱讀官方報告或造訪 MiniMax 網站。

效果評估

MiniMax M3 透過記錄在案的自主任務展現強大的實際能力，例如在 12 小時內重現 ICLR 2025 論文，並在 24 小時內優化 CUDA 核心以實現 9.4 倍加速。這些範例顯示了可靠的長時執行能力與深度多模態整合。該模型的開放權重特性以及在 BrowseComp 等基準測試中的前沿表現，顯示其是先進程式碼編寫與代理工作流程的實用工具。雖然網站未包含使用者回饋或獎項，但其功能集暗示對於需要自主、長上下文 AI 輔助的團隊具有高度實用性。

Frequently Asked Questions

什麼是 MiniMax M3？

MiniMax M3 是一個開放權重的模型，專為編碼、自主任務和多模態理解設計，採用 MSA 架構，支援 100 萬 token 的上下文視窗。

MiniMax M3 是開源的嗎？

是的，MiniMax M3 是開放權重的，意味著模型權重可公開使用和修改。

MiniMax M3 的上下文視窗大小是多少？

MiniMax M3 支援 100 萬 token 的上下文視窗，能夠處理非常長的文件或對話。

MiniMax M3 針對哪些任務進行了最佳化？

它針對編碼、自主任務（例如自主決策）和多模態理解（例如文字、圖像）進行了最佳化。

什麼是 MSA 架構？

MSA（混合稀疏注意力）是驅動 MiniMax M3 的架構，專為高效的長上下文處理而設計。

MiniMax M3 可以處理圖像嗎？

是的，它支援多模態理解，包括圖像輸入，以及文字。