Multimodal2026-04-22The Verge

OpenAIの画像生成AI、ウェブから情報を引き出せるように

OpenAIは、画像生成技術に対する重要なアップグレードを発表した。新しいChatGPT Images 2.0モデルは、その創造的プロセスに情報を提供するためにウェブを検索することを可能にする「思考能力」を導入している。これは、AIがインターネットからリアルタイムの情報と文脈を取り込み、単一のシンプルなプロンプトからより洗練され正確な視覚的アウトプットを生成できるようになったことを意味する。 この進歩は、静的なデータセットから画像を生成することを超えている。その生成物を現在のウェブ知識に基づかせることで、モデルはより文脈を理解し関連性の高い視覚的コンテンツを生み出すことができる。例えば、ユーザーが「2040年の未来的な都市景観」の画像を要求した場合、モデルは現在の都市デザインのトレンドと技術的予測を調査し、より説得力のある詳細なシーンを作成することが可能だ。 このアップデートは、より自律的で知識に基づいたマルチモーダルAIシステムへの大きな一歩を表している。これは創造的なツールとリサーチアシスタントの境界を曖昧にし、以前は相当な人間のガイダンスを必要としていた、情報に依存する複雑なリクエストをAIが処理できるようにする。これはより強力な創造的および教育的応用を約束する一方で、生成に使用されるウェブソース情報の正確性と適切性を確保するための堅牢な保護策の必要性の進化も浮き彫りにしている。

関連ニュース

もっとAIニュース

AIStart.ai · あなた専用の AI ランチパッド