Model Update2026-05-29
The Verge
Claude 新模型在出錯時變得更加「誠實」
Anthropic 發布了其最新 AI 模型 Claude Opus 4.8,其獨特重點在於「誠實性」。該公司訓練模型避免做出未經證實的主張,解決了 AI 中一個長期存在的問題:模型有時會生成看似自信但實際不正確的陳述。這種對透明度與可靠性的重視,旨在與使用者建立更大的信任,特別是在準確性至關重要的關鍵應用中。
Claude Opus 4.8 被設計成能夠識別自身的局限性,並在缺乏足夠資訊時表達不確定性。該模型現在更有可能說「我不知道」或提供免責聲明,而不是編造答案或猜測。這一轉變代表了負責任 AI 發展的重要一步,因為它降低了錯誤資訊的風險,並增強了模型在醫療、法律和金融等領域的實用性。
Anthropic 的方法與一些優先考慮速度或創造力而非準確性的競爭對手形成對比。透過訓練模型變得更加「誠實」,該公司希望為 AI 可靠性樹立新標竿。早期測試表明,Claude Opus 4.8 在複雜任務上保持強勁性能,同時顯著降低了幻覺率。
此次發布正值人們對 AI 傳播虛假資訊的潛在風險日益關注之際。Anthropic 對誠實性的關注可能使其在信任與合規至關重要的企業市場中獲得優勢。使用者可以期待該模型提供更細緻的回應,清楚區分已確認的事實與推測性內容。此更新是業界朝向更透明、更負責任的 AI 系統發展的廣泛趨勢的一部分,因為監管機構和使用者要求更清楚地了解模型如何得出其輸出結果。