Multimodal2026-04-22
The Verge
El generador de imágenes de OpenAI ahora puede obtener información de la web
OpenAI ha presentado una actualización significativa de su tecnología de generación de imágenes. El nuevo modelo ChatGPT Images 2.0 introduce 'capacidades de razonamiento' que le permiten buscar en la web para informar su proceso creativo. Esto significa que la IA ahora puede obtener información y contexto en tiempo real de internet para producir resultados visuales más sofisticados y precisos a partir de una sola instrucción simple.
Este avance va más allá de generar imágenes a partir de un conjunto de datos estático. Al basar sus creaciones en el conocimiento web actual, el modelo puede producir visuales que son más conscientes del contexto y relevantes. Por ejemplo, un usuario podría pedir una imagen de un 'paisaje urbano futurista en 2040', y el modelo podría investigar las tendencias actuales de diseño urbano y proyecciones tecnológicas para crear una escena más plausible y detallada.
La actualización representa un paso importante hacia sistemas de IA multimodal más autónomos y basados en conocimiento. Difumina la línea entre una herramienta creativa y un asistente de investigación, permitiendo que la IA maneje solicitudes complejas y dependientes de información que anteriormente requerían una guía humana significativa. Si bien esto promete aplicaciones creativas y educativas más potentes, también destaca la necesidad evolutiva de salvaguardas robustas para garantizar la precisión y pertinencia de la información obtenida de la web utilizada en la generación.
