Multimodal2026-04-24WIRED AI

OpenAI 强化 ChatGPT 图像生成模型

OpenAI 推出了 ChatGPT 图像生成能力的重大升级,发布了 ChatGPT Images 2.0。与上一代相比,新模型承诺提供更清晰的细节、更准确的文字渲染以及整体更优的视觉质量。早期测试证实,此次更新确实实现了许多承诺,但仍存在一些局限性,尤其是在非英语语言方面。 最显著的改进在于图像细节。ChatGPT Images 2.0 现在能够生成此前无法企及的逼真纹理、复杂光照场景和精细图案。例如,动物图像现在能显示出一根根毛发,建筑渲染图则包含逼真的反射和阴影。这使得该模型在产品设计、营销材料和概念艺术等专业应用中更加实用。 文字渲染——AI 图像生成器的一个著名弱点——也取得了实质性进展。新模型能够以更高的准确度将可读文字嵌入图像中,处理不同的字体、大小和方向。这对于制作海报、信息图表和社交媒体内容来说是一个游戏规则改变者,因为在这些场景中,清晰的文字至关重要。然而,这一改进主要局限于英语。当使用中文、阿拉伯语或印地语等语言进行测试时,该模型仍然会产生乱码或无意义的字符,这表明 OpenAI 的训练数据仍然严重偏向英语内容。 此次更新还引入了更好的构图理解能力。用户现在可以指定包含多个对象和空间关系的复杂场景,模型通常能正确排列它们。例如,像“一只猫坐在红色椅子上,旁边是窗外下着雨的窗户”这样的提示词,现在能生成准确反映所有元素的结果。这减少了反复调整提示词的需求,使该工具对普通用户更加友好。 ChatGPT Images 2.0 正在向所有 ChatGPT Plus 用户推出。

相关资讯

更多 AI 资讯

AIStart.ai · 你的专属 AI 启动台