
AI Infrastructure2026-07-01
Ars Technica
新攻击曝光:告诉AI“2+2=5”就能绕过安全护栏
研究人员发现一种新攻击方法,暴露了AI浏览器的严重漏洞:简单的逻辑矛盾就能绕过其安全护栏。研究人员发现,只要告诉大语言模型“2+2=5”,就能骗它执行被禁止的指令,比如生成有害内容或访问受限数据。这种攻击利用了AI倾向于优先接受用户提供的前提,而不是自己的训练知识,从而有效破坏了防止滥用的安全机制。这个漏洞引发了人们对AI浏览器安全的严重担忧,这类浏览器正越来越多地被用于网页搜索和自动填表等任务。研究结果凸显了当前AI对齐技术的脆弱性,看似无害的逻辑谬误就能攻破。安全专家警告,随着AI浏览器越来越普及,这种漏洞可能被用于钓鱼、数据窃取或传播虚假信息。研究强调需要更强大的护栏机制来抵抗对抗性操纵。开发者正在紧急修复这个漏洞,但这件事是一个鲜明的提醒:AI安全仍然是一个持续的挑战。