Open Source2026-06-02
Hugging Face Blog
NVIDIA Cosmos 3:面向物理AI的开放全模态模型
NVIDIA 已正式发布 Cosmos 3,这是一个开创性的开放全模态模型,专为物理AI的推理和行动而设计。与仅在数字空间运行的传统AI模型不同,Cosmos 3 旨在帮助机器人和自主系统实时理解、导航并与物理世界交互。
此次发布标志着具身AI领域向前迈出了重要一步,机器必须弥合模拟与现实之间的差距。Cosmos 3 处理多模态输入——包括视觉、触觉和空间数据——以在动态环境中生成连贯的动作。例如,使用 Cosmos 3 的仓库机器人不仅可以识别物体,还可以预测物体在被移动时的行为方式,从而实现更安全、更高效的操作。
该模型是开源的,NVIDIA 希望这将加速机器人技术和自主系统行业的研发。通过提供一个可供他人构建的基础模型,NVIDIA 旨在让尖端物理AI能力的获取更加民主化。
早期应用预计将出现在制造业、物流、医疗机器人以及自动驾驶汽车领域。对物理规律(如重力、摩擦力和物体恒存性)进行推理的能力,使 Cosmos 3 比缺乏真实世界基础的传统AI模型更具优势。
行业分析师对此举表示赞赏,指出物理AI长期以来一直因缺乏稳健的开放模型而受到阻碍。通过 Cosmos 3,NVIDIA 正将自己定位在下一波AI创新的中心,在这个浪潮中,机器不仅会思考——它们还会行动。