OpenAI 強化 ChatGPT 的圖像生成模型

OpenAI 已推出 ChatGPT 圖像生成功能的重大升級，發布了 ChatGPT Images 2.0。這款新模型承諾提供更清晰的細節、更準確的文字渲染，以及整體上比前代更優越的視覺品質。早期測試證實，此次更新確實實現了許多承諾，但仍存在一些限制，特別是在非英語語言方面。最顯著的改進在於圖像細節。ChatGPT Images 2.0 現在能夠生成照片級真實感的紋理、複雜的光影場景以及精細的圖案，這些在過去是無法達到的。例如，動物圖像現在能呈現出個別的毛髮絲，建築渲染圖則包含逼真的反射和陰影。這使得該模型在產品設計、行銷素材和概念藝術等專業應用中更加實用。文字渲染——AI 圖像生成器眾所周知的弱點——也獲得了大幅提升。新模型能夠以更高的準確度將可讀文字嵌入圖像中，並能處理不同的字體、大小和方向。這對於製作海報、資訊圖表和社群媒體內容來說是一項重大突破，因為這些場合中清晰可讀的文字至關重要。然而，這項改進主要僅限於英語。當使用中文、阿拉伯語或印地語等語言進行測試時，該模型仍會產生亂碼或無意義的字元，這表明 OpenAI 的訓練資料仍然嚴重偏向英語內容。此次更新還引入了更好的構圖理解能力。使用者現在可以指定包含多個物體和空間關係的複雜場景，而模型通常能正確地安排它們。例如，像「一隻貓坐在窗邊的紅色椅子上，窗外下著雨」這樣的提示，現在能產生準確反映所有元素的結果。這減少了反覆調整提示的需求，使該工具對一般使用者來說更加易用。 ChatGPT Images 2.0 正在向所有 ChatGPT Plus 用戶推出。

OpenAI 強化 ChatGPT 的圖像生成模型

相关资讯