AI Infrastructure2026-06-13NVIDIA AI Blog

NVIDIA Blackwell 領先首個代理型 AI 基準測試

人工智慧的格局正在迅速演變,隨著自主 AI 代理的興起,對標準化性能指標的需求從未如此迫切。AgentPerf 應運而生,這是首個專門設計用於衡量運行代理型 AI 工作負載系統能力的行業基準測試。由 Artificial Analysis 開發,這項新基準測試為開發者和企業提供了一種清晰、公平的硬體性能比較方式,針對需要 AI 進行規劃、推理和執行多步驟操作的任務。 在其首次發布的結果中,NVIDIA Blackwell Ultra NVL72 平台脫穎而出,成為頂級性能表現者,為代理型 AI 基礎設施樹立了新標準。這一成就凸顯了 NVIDIA 在 AI 硬體領域持續的主導地位,特別是在複雜的即時決策任務方面。NVL72 架構憑藉其巨大的記憶體頻寬和先進的張量核心設計,專為處理代理型模型所需的迭代推理循環和大上下文視窗而打造。 對於希望在生產環境中部署 AI 代理的企業——無論是用於客戶服務自動化、程式碼生成還是自主研究——AgentPerf 基準測試為採購決策提供了一個關鍵工具。與其依賴測試簡單文字生成或圖像分類的通用 AI 基準測試不同,AgentPerf 評估系統維持連貫的多輪互動以及執行複雜工作流程的能力。這使得它對於 AI 代理必須長時間自主運行的實際應用更具相關性。 AgentPerf 的推出標誌著 AI 行業的顯著成熟。隨著代理型 AI 從研究實驗室進入關鍵業務應用,擁有一個可信賴的獨立基準測試將幫助組織避免代價高昂的基礎設施錯誤。隨著 NVIDIA 的 Blackwell 平台領先群雄,訊息很明確:AI 的未來不僅僅是生成內容,而是關於行動與自主性。

相關資訊