
AI Infrastructure2026-06-13
NVIDIA AI Blog
NVIDIA Blackwell 领跑首个智能体AI基准测试
人工智能领域正在快速发展,随着自主AI智能体的兴起,对标准化性能指标的需求比以往任何时候都更加迫切。AgentPerf 应运而生,这是首个专门用于衡量运行智能体AI工作负载的系统能力的行业基准测试。该基准测试由 Artificial Analysis 开发,为开发者和企业提供了一种清晰、公平的硬件性能比较方法,适用于需要AI进行规划、推理和执行多步骤操作的任务。
在首批结果中,NVIDIA Blackwell Ultra NVL72 平台脱颖而出,成为性能最佳的平台,为智能体AI基础设施树立了新标准。这一成就凸显了 NVIDIA 在AI硬件领域,特别是在复杂的实时决策任务中的持续主导地位。NVL72 架构凭借其巨大的内存带宽和先进的张量核心设计,专为处理智能体模型所需的迭代推理循环和大上下文窗口而构建。
对于希望在生成环境中部署AI智能体的企业——无论是用于客户服务自动化、代码生成还是自主研究——AgentPerf 基准测试为其采购决策提供了关键工具。AgentPerf 并非依赖测试简单文本生成或图像分类的通用AI基准测试,而是评估系统维持连贯的多轮交互和执行复杂工作流的能力。这使得它对于AI智能体必须在较长时间内自主运行的实际应用场景更具相关性。
AgentPerf 的推出标志着AI行业的重要成熟。随着智能体AI从研究实验室进入关键业务应用,拥有一个值得信赖的独立基准测试将帮助组织避免代价高昂的基础设施错误。随着 NVIDIA Blackwell 平台领跑,信息很明确:AI的未来不仅仅是生成内容,更是关于执行。