AI Safety2026-06-20Ars Technica

黑客级AI模型已成定局,谁也拦不住

越来越多的网络安全专家和AI研究者发出警告:具备高级黑客能力的AI模型不是会不会出现的问题,而是什么时候出现的问题。尽管各国都在想办法监管,但AI发展的趋势表明,危险的、能自主攻击的黑客工具很快就会遍地都是,对全球数字基础设施构成前所未有的威胁。 这个警告的背景是美国政府最近对Anthropic的Claude模型下了狠手,因为发现它具备高级漏洞利用能力。这件事暴露了一个根本问题:AI模型越强大、越容易获取,就越难控制它们的恶意用途。尤其是开源模型,随便谁都能拿来微调,干点见不得人的事,根本没人管。 专家们认为,AI安全研究者和恶意攻击者之间的猫鼠游戏,本质上就是不对称的。安全措施可以延缓滥用,但根本挡不住那些铁了心要搞事的家伙。他们可以把模型改造成黑客工具,比如自动找漏洞、搞社会工程学攻击、甚至零日漏洞利用。AI的普及意味着,以前只有顶级黑客才会的技能,现在可能连脚本小子和国家背景的黑客组织都能轻松上手。 更麻烦的是,AI进步的速度远超监管框架。各国政府连怎么定义和限制AI能力边界都搞不清楚,更别提那些在监管宽松地区开发的模型了。结果就是全球一盘散沙,危险的AI工具可以在相对无风险的环境下被开发和部署。 为了降低风险,专家们建议采取一些主动措施,比如给模型加水印、监控使用情况、签国际条约限制AI能力。但很多人也承认,这些手段不太可能完全阻止必然发生的事情。最好的防御,就是投资AI驱动的防御系统,让它们能跟恶意模型在攻击能力上打个平手——说白了,就是搞一场新的网络军备竞赛。 随着AI继续进化,工具和武器之间的界限会越来越模糊,社会将不得不面对关于监管、伦理以及技术进步本质的那些让人不舒服的问题。

相关资讯