
Multimodal2026-04-24
WIRED AI
OpenAI mejora el modelo de generación de imágenes de ChatGPT
OpenAI ha implementado una mejora significativa en las capacidades de generación de imágenes de ChatGPT con el lanzamiento de ChatGPT Images 2.0. El nuevo modelo promete detalles más nítidos, un renderizado de texto más preciso y una calidad visual general mejorada en comparación con su predecesor. Las pruebas iniciales confirman que la actualización cumple muchas de estas promesas, aunque persisten algunas limitaciones, particularmente con idiomas que no sean inglés.
La mejora más notable está en el detalle de la imagen. ChatGPT Images 2.0 ahora puede generar texturas fotorrealistas, escenarios de iluminación complejos y patrones intrincados que antes estaban fuera de su alcance. Por ejemplo, las imágenes de animales ahora muestran hebras de pelo individuales, y los renderizados arquitectónicos incluyen reflejos y sombras realistas. Esto hace que el modelo sea mucho más útil para aplicaciones profesionales como el diseño de productos, materiales de marketing y arte conceptual.
El renderizado de texto —un punto débil notorio de los generadores de imágenes con IA— también ha experimentado avances sustanciales. El nuevo modelo puede incrustar texto legible en las imágenes con una precisión mucho mayor, manejando diferentes fuentes, tamaños y orientaciones. Esto es un cambio radical para crear carteles, infografías y contenido para redes sociales donde el texto legible es esencial. Sin embargo, la mejora se limita principalmente al inglés. Cuando se prueba con idiomas como chino, árabe o hindi, el modelo aún produce caracteres ilegibles o sin sentido, lo que sugiere que los datos de entrenamiento de OpenAI siguen estando fuertemente sesgados hacia contenido en inglés.
La actualización también introduce una mejor comprensión compositiva. Los usuarios ahora pueden especificar escenas complejas con múltiples objetos y relaciones espaciales, y el modelo generalmente los organizará correctamente. Por ejemplo, una instrucción como 'un gato sentado en una silla roja junto a una ventana con lluvia afuera' ahora produce resultados que reflejan con precisión todos los elementos. Esto reduce la necesidad de instrucciones iterativas y hace que la herramienta sea más accesible para los usuarios ocasionales.
ChatGPT Images 2.0 se está implementando para todos los usuarios de ChatGPT Plus y
