Multimodal2026-04-22
The Verge
OpenAI图像生成器现可从网络获取信息
OpenAI揭晓了其图像生成技术的一次重大升级。新的ChatGPT图像2.0模型引入了“思考能力”,使其能够搜索网络以辅助其创作过程。这意味着该AI现在可以从互联网获取实时信息和上下文,从而根据单一、简单的提示生成更复杂、更准确的视觉输出。
这一进展超越了从静态数据集生成图像。通过将其创作基于当前的网络知识,该模型能够生成更具语境感知和更相关的视觉内容。例如,用户可以要求生成一张“2040年的未来主义城市景观”图像,模型可以研究当前的都市设计趋势和技术预测,以创建一个更合理、更详细的场景。
此次更新代表了向更自主、基于知识的多模态AI系统迈出的重要一步。它模糊了创意工具和研究助手之间的界限,使AI能够处理复杂的、依赖信息的请求,而这在以前需要大量的人工指导。虽然这预示着更强大的创意和教育应用,但也突显了日益增长的需求,即需要强有力的保障措施,以确保生成过程中所使用的网络来源信息的准确性和适当性。
