Model Update2026-02-20
MIT Technology Review
谷歌DeepMind审视AI聊天机器人的道德行为
谷歌DeepMind的研究人员呼吁建立评估大语言模型的新标准:严格评估其道德行为。随着AI聊天机器人从单纯的信息工具演变为伴侣、导师和顾问,该团队认为,关键不仅在于了解它们知道什么,还要了解它们如何进行伦理决策。核心问题是这些模型是否真正内化了道德原则,还是仅仅在模仿训练数据中的模式。研究人员提出了一系列评估框架,旨在测试模型在复杂、模糊情境下的道德推理、一致性和稳健性。
