Multimodal2026-04-24WIRED AI

OpenAI verbessert das Bildgenerierungsmodell von ChatGPT

OpenAI hat mit der Veröffentlichung von ChatGPT Images 2.0 ein bedeutendes Upgrade der Bildgenerierungsfähigkeiten von ChatGPT eingeführt. Das neue Modell verspricht schärfere Details, eine genauere Textdarstellung und insgesamt eine verbesserte visuelle Qualität im Vergleich zu seinem Vorgänger. Erste Tests bestätigen, dass das Update viele dieser Versprechen einlöst, obwohl einige Einschränkungen bestehen bleiben, insbesondere bei nicht-englischen Sprachen. Die auffälligste Verbesserung liegt im Bilddetail. ChatGPT Images 2.0 kann jetzt fotorealistische Texturen, komplexe Lichtszenarien und komplizierte Muster erzeugen, die zuvor außerhalb seiner Reichweite lagen. Beispielsweise zeigen Bilder von Tieren jetzt einzelne Haarsträhnen, und Architekturvisualisierungen enthalten realistische Reflexionen und Schatten. Dies macht das Modell weitaus nützlicher für professionelle Anwendungen wie Produktdesign, Marketingmaterialien und Konzeptkunst. Auch die Textdarstellung – ein bekannter Schwachpunkt von KI-Bildgeneratoren – hat deutliche Fortschritte gemacht. Das neue Modell kann lesbaren Text mit weitaus höherer Genauigkeit in Bilder einbetten und dabei verschiedene Schriftarten, -größen und -ausrichtungen verarbeiten. Dies ist ein Game-Changer für die Erstellung von Postern, Infografiken und Social-Media-Inhalten, bei denen lesbarer Text unerlässlich ist. Die Verbesserung beschränkt sich jedoch hauptsächlich auf Englisch. Bei Tests mit Sprachen wie Chinesisch, Arabisch oder Hindi produziert das Modell immer noch verstümmelte oder sinnlose Zeichen, was darauf hindeutet, dass die Trainingsdaten von OpenAI nach wie vor stark auf englischsprachige Inhalte ausgerichtet sind. Das Update führt auch ein besseres Verständnis für die Komposition ein. Benutzer können jetzt komplexe Szenen mit mehreren Objekten und räumlichen Beziehungen angeben, und das Modell wird diese im Allgemeinen korrekt anordnen. Beispielsweise liefert eine Eingabeaufforderung wie 'eine Katze, die auf einem roten Stuhl neben einem Fenster sitzt, während es draußen regnet' jetzt Ergebnisse, die alle Elemente genau widerspiegeln. Dies reduziert die Notwendigkeit iterativer Eingabeaufforderungen und macht das Werkzeug für Gelegenheitsnutzer zugänglicher. ChatGPT Images 2.0 wird für alle ChatGPT Plus- und

Noticias relacionadas

Más noticias de IA

AIStart.ai · Tu Launchpad personal de IA