Model Update2026-05-29The Verge

Claude的新模型在出错时更加“诚实”

Anthropic发布了其最新AI模型Claude Opus 4.8,其独特重点是“诚实性”。该公司训练该模型避免做出无依据的断言,解决了AI中一个长期存在的问题,即模型有时会生成自信但错误的陈述。这种对透明度和可靠性的强调旨在与用户建立更大的信任,特别是在准确性至关重要的关键应用中。 Claude Opus 4.8被设计为能够识别自身的局限性,并在缺乏足够信息时传达不确定性。该模型现在更有可能说“我不知道”或提供免责声明,而不是编造答案或猜测。这一转变代表了负责任的AI开发迈出的重要一步,因为它降低了错误信息的风险,并增强了模型在医疗、法律和金融等领域的实用性。 Anthropic的方法与一些优先考虑速度或创造力而非准确性的竞争对手形成对比。通过训练模型更加“诚实”,该公司希望为AI可靠性树立新标准。早期测试表明,Claude Opus 4.8在复杂任务上保持强劲性能,同时显著降低了幻觉率。 此次发布正值人们对AI传播虚假信息的潜力日益关注之际。Anthropic对诚实性的关注可能使其在信任和合规至关重要的企业市场中占据优势。用户可以期待该模型提供更细致的回答,清晰区分已确认的事实和推测性内容。此次更新是更广泛的行业趋势的一部分,即朝着更透明、更负责任的AI系统发展,因为监管机构和用户要求更清楚地了解模型如何得出其输出结果。

相关资讯