Model Update2026-05-29
The Verge
Claudeの新モデル、間違えた時に「正直」になる
Anthropicは、最新のAIモデル「Claude Opus 4.8」をリリースしました。このモデルは「正直さ」に特に重点を置いています。同社は、モデルが根拠のない主張をしないようにトレーニングし、AIが時に自信満々でありながら誤った発言を生成するという永続的な問題に対処しています。この透明性と信頼性への重点は、特に正確性が最も重要となる重要なアプリケーションにおいて、ユーザーとのより大きな信頼を構築するために設計されています。
Claude Opus 4.8は、自身の限界を認識し、十分な情報がない場合には不確実性を伝達するように設計されています。回答をでっち上げたり推測したりする代わりに、このモデルは「わかりません」と言ったり、注意書きを提供したりする可能性が高くなりました。この変化は、責任あるAI開発における重要な一歩であり、誤情報のリスクを低減し、医療、法律、金融などの分野におけるモデルの有用性を高めます。
Anthropicのアプローチは、速度や創造性を正確性よりも優先する一部の競合他社とは対照的です。モデルをより「正直」にトレーニングすることで、同社はAIの信頼性に新たな基準を設定したいと考えています。初期のテストでは、Claude Opus 4.8は複雑なタスクで強力なパフォーマンスを維持しながら、幻覚率を大幅に低減していることが示唆されています。
このリリースは、AIが誤った情報を拡散する可能性に対する監視が高まる中で行われました。Anthropicの正直さへの焦点は、信頼とコンプライアンスが重要となるエンタープライズ市場において、同社に優位性をもたらす可能性があります。ユーザーは、確認された事実と推測的なコンテンツを明確に区別する、よりニュアンスのある応答を期待できます。このアップデートは、規制当局やユーザーがモデルがどのように出力に至るかについてのより明確な説明を求める中で、より透明性が高く説明責任のあるAIシステムへの広範な業界トレンドの一部です。