
Model Update2026-06-02
NVIDIA AI Blog
NVIDIA Cosmos 3 hilft Physical AI, vor dem Handeln nachzudenken
NVIDIA hat Cosmos 3 vorgestellt, ein offenes Omni-Modell, das physischen KI-Systemen die Fähigkeit verleiht, vor dem Handeln zu argumentieren und zu planen. Dieses Foundation-Modell stellt einen bedeutenden Fortschritt auf dem Gebiet der verkörperten KI dar, bei der Maschinen sicher und effizient mit der physischen Welt interagieren müssen. Im Gegensatz zu traditionellen KI-Modellen, die auf Eingaben reagieren, ermöglicht Cosmos 3 physischen KI-Systemen, vorauszudenken. Bevor ein Roboter seinen Arm bewegt, ein Fahrzeug steuert oder ein Objekt manipuliert, kann er die Konsequenzen seiner Handlungen simulieren und den sichersten, effizientesten Weg wählen. Diese „Erst denken, dann handeln“-Fähigkeit ist entscheidend für Anwendungen, bei denen Fehler kostspielig oder gefährlich sein können. Das Modell ist als „Omni-Modell“ konzipiert, was bedeutet, dass es mehrere Arten von sensorischen Eingaben und Ausgabemodalitäten verarbeiten kann. Es verarbeitet visuelle Daten, räumliche Informationen und Aufgabenanweisungen, um ein umfassendes Verständnis der Umgebung und des gewünschten Ergebnisses zu schaffen. Dies ermöglicht es physischen KI-Systemen, in komplexen, unstrukturierten Umgebungen mit größerer Zuverlässigkeit zu operieren. Einer der wichtigsten Durchbrüche von Cosmos 3 ist seine Fähigkeit, die Lücke zwischen Simulation und der realen Welt zu überbrücken. Das Modell kann in simulierten Umgebungen trainiert werden, in denen es Millionen von Szenarien sicher erkunden kann, und dieses Wissen dann auf physische Roboter übertragen. Dieser Simulation-zu-Real-Transfer ist für die Entwicklung robuster autonomer Systeme unerlässlich, die mit der Unvorhersehbarkeit der realen Welt umgehen können. Sicherheit steht bei Cosmos 3 im Vordergrund. Durch die vorausschauende Planung von Aktionen und die Berücksichtigung mehrerer möglicher Ergebnisse kann das System Kollisionen vermeiden, Schäden an der Ausrüstung verhindern und sicherstellen, dass seine Bewegungen für in der Nähe befindliche Menschen sicher sind. Dies macht es für Anwendungen in der Fertigung, Logistik, im Gesundheitswesen und bei autonomen Fahrzeugen geeignet. NVIDIA veröffentlicht Cosmos 3 als offenes Modell, sodass Forscher und Entwickler weltweit auf dieser Grundlage aufbauen können. Es wird erwartet, dass dieser offene Ansatz die Innovation in