
Model Update2026-06-02
NVIDIA AI Blog
NVIDIA Cosmos 3助力物理AI三思而后行
NVIDIA推出了Cosmos 3,这是一个开源的全模态模型,旨在赋予物理AI系统在采取行动之前进行推理和规划的能力。该基础模型代表了具身AI领域的重大进步,在该领域中,机器必须安全高效地与物理世界交互。
与对输入做出反应的传统AI模型不同,Cosmos 3使物理AI系统能够提前思考。在机器人移动手臂、驾驶车辆或操纵物体之前,它可以模拟其行动的后果,并选择最安全、最高效的路径。这种“三思而后行”的能力对于错误可能代价高昂或危险的应用至关重要。
该模型被设计为“全模态模型”,意味着它可以处理多种类型的感官输入和输出模式。它处理视觉数据、空间信息和任务指令,以创建对环境和预期结果的全面理解。这使得物理AI系统能够在复杂、非结构化的环境中以更高的可靠性运行。
Cosmos 3的关键突破之一是其弥合仿真与现实世界之间差距的能力。该模型可以在模拟环境中进行训练,安全地探索数百万种场景,然后将这些知识迁移到物理机器人上。这种从仿真到现实的迁移对于开发能够应对现实世界不可预测性的稳健自主系统至关重要。
安全性是Cosmos 3的主要关注点。通过提前规划行动并考虑多种可能的结果,该系统可以避免碰撞、防止设备损坏,并确保其动作对附近人员安全。这使得它适用于制造、物流、医疗保健和自动驾驶汽车等应用。
NVIDIA将Cosmos 3作为开源模型发布,允许全球的研究人员和开发者在此基础之上进行构建。这种开放方式预计将加速物理AI领域的创新。