谷歌DeepMind审视AI聊天机器人的道德行为

谷歌DeepMind的研究人员呼吁建立评估大语言模型的新标准：严格评估其道德行为。随着AI聊天机器人从单纯的信息工具演变为伴侣、导师和顾问，该团队认为，关键不仅在于了解它们知道什么，还要了解它们如何进行伦理决策。核心问题是这些模型是否真正内化了道德原则，还是仅仅在模仿训练数据中的模式。研究人员提出了一系列评估框架，旨在测试模型在复杂、模糊情境下的道德推理、一致性和稳健性。