OpenAI 强化 ChatGPT 图像生成模型

OpenAI 推出了 ChatGPT 图像生成能力的重大升级，发布了 ChatGPT Images 2.0。与上一代相比，新模型承诺提供更清晰的细节、更准确的文字渲染以及整体更优的视觉质量。早期测试证实，此次更新确实实现了许多承诺，但仍存在一些局限性，尤其是在非英语语言方面。最显著的改进在于图像细节。ChatGPT Images 2.0 现在能够生成此前无法企及的逼真纹理、复杂光照场景和精细图案。例如，动物图像现在能显示出一根根毛发，建筑渲染图则包含逼真的反射和阴影。这使得该模型在产品设计、营销材料和概念艺术等专业应用中更加实用。文字渲染——AI 图像生成器的一个著名弱点——也取得了实质性进展。新模型能够以更高的准确度将可读文字嵌入图像中，处理不同的字体、大小和方向。这对于制作海报、信息图表和社交媒体内容来说是一个游戏规则改变者，因为在这些场景中，清晰的文字至关重要。然而，这一改进主要局限于英语。当使用中文、阿拉伯语或印地语等语言进行测试时，该模型仍然会产生乱码或无意义的字符，这表明 OpenAI 的训练数据仍然严重偏向英语内容。此次更新还引入了更好的构图理解能力。用户现在可以指定包含多个对象和空间关系的复杂场景，模型通常能正确排列它们。例如，像“一只猫坐在红色椅子上，旁边是窗外下着雨的窗户”这样的提示词，现在能生成准确反映所有元素的结果。这减少了反复调整提示词的需求，使该工具对普通用户更加友好。 ChatGPT Images 2.0 正在向所有 ChatGPT Plus 用户推出。

OpenAI 强化 ChatGPT 图像生成模型

相关资讯