Multimodal2026-04-24WIRED AI

OpenAI 強化 ChatGPT 的圖像生成模型

OpenAI 已推出 ChatGPT 圖像生成功能的重大升級,發布了 ChatGPT Images 2.0。這款新模型承諾提供更清晰的細節、更準確的文字渲染,以及整體上比前代更優越的視覺品質。早期測試證實,此次更新確實實現了許多承諾,但仍存在一些限制,特別是在非英語語言方面。 最顯著的改進在於圖像細節。ChatGPT Images 2.0 現在能夠生成照片級真實感的紋理、複雜的光影場景以及精細的圖案,這些在過去是無法達到的。例如,動物圖像現在能呈現出個別的毛髮絲,建築渲染圖則包含逼真的反射和陰影。這使得該模型在產品設計、行銷素材和概念藝術等專業應用中更加實用。 文字渲染——AI 圖像生成器眾所周知的弱點——也獲得了大幅提升。新模型能夠以更高的準確度將可讀文字嵌入圖像中,並能處理不同的字體、大小和方向。這對於製作海報、資訊圖表和社群媒體內容來說是一項重大突破,因為這些場合中清晰可讀的文字至關重要。然而,這項改進主要僅限於英語。當使用中文、阿拉伯語或印地語等語言進行測試時,該模型仍會產生亂碼或無意義的字元,這表明 OpenAI 的訓練資料仍然嚴重偏向英語內容。 此次更新還引入了更好的構圖理解能力。使用者現在可以指定包含多個物體和空間關係的複雜場景,而模型通常能正確地安排它們。例如,像「一隻貓坐在窗邊的紅色椅子上,窗外下著雨」這樣的提示,現在能產生準確反映所有元素的結果。這減少了反覆調整提示的需求,使該工具對一般使用者來說更加易用。 ChatGPT Images 2.0 正在向所有 ChatGPT Plus 用戶推出。

相关资讯

更多 AI 资讯

AIStart.ai · 你的专属 AI 启动台