关键要点:
- 白宫要求Anthropic消除Fable 5和Mythos 5模型上的所有越狱漏洞
- 安全专家表示,对于大型语言模型而言,阻止所有可能的越狱攻击在技术上是不可行的
- 僵局导致包括苹果、Meta以及大量《财富》500强企业在内的企业客户无法使用
关键要点:

特朗普政府正要求Anthropic阻止其最先进AI模型的所有可能越狱攻击——这一技术上的不可能要求已使双方在AI监管的未来问题上陷入僵局。
据一位白宫高级官员和另一位熟悉情况的行政官员透露,白宫正要求Anthropic消除其Fable 5和Mythos 5模型中的所有可能安全漏洞,这一技术上无法达到的标准已升级为一场围绕AI监管未来的僵局。
"问题在于,白宫一直处于这种极端的反监管姿态,而现在他们正面临人们多年来一直预测的真正AI能力,"一位前白宫技术官员表示,他要求匿名以免影响职业关系。"本应早有准备和政策来系统性地应对这一问题,管理好收益和风险,但结果却是这种草率行事的方式,让AI行业陷入了真正的困境。"
这场争端爆发于白宫于6月13日对Anthropic实施出口管制,迫使该公司暂停所有用户对这两款模型的访问。亚马逊CEO安迪·贾西曾警告财政部长斯科特·贝森特,研究人员发现了防护栏被绕过的证据。Anthropic辩称该漏洞是有限的,并不构成有意义的安全缺陷,但政府回应称禁止外国用户访问这些模型。该公司选择完全撤下这些模型,声称这是遵守出口管制的唯一途径。
这场僵局涉及重大的经济利益。Anthropic的企业客户——包括苹果、Meta以及大量《财富》500强企业——仍无法使用该公司最先进的系统。这场争端也冻结了该公司部署新模型的能力,可能减缓其收入增长及相对于竞争对手OpenAI和Google DeepMind的竞争地位。
争端核心的技术不可行性
安全研究人员和AI高管表示,白宫的要求在当前技术条件下无法实现。由于大型语言模型是概率性而非确定性的,公司无法保证它们对任何给定提示词会生成什么内容。每个模型都可以在不同程度上被越狱,而完全解决这一问题在现有方法下并不可行。
Anthropic和独立网络安全研究人员认为,越狱并非一个可以单独修补的孤立问题。该公司最初的辩护是,没有任何AI模型可以完全免疫黑客攻击——这一立场激怒了白宫官员,他们指出Anthropic多年来一直在警告AI可能带来的灾难。
白宫与Anthropic之间的谈判——由公司方面负责公共政策的莎拉·赫克和联合创始人汤姆·布朗牵头——已转向制定一套共同的基准来评估未来的越狱攻击,包括防护栏被绕过的程度、被暴露的能力以及漏洞的实际后果。虽然出口管制尚未解除,但转向技术标准制定工作表明谈判正在取得进展。
事实上的许可制度正在形成
特朗普政府此前曾反对强制性的AI许可。总统特朗普上月签署了一项行政命令,为AI实验室创建了一个"自愿"系统,允许其提前提交模型供政府测试,并明确附加条款说明这不会变成强制性要求。但Anthropic争端实际上已催生了一套特设版本的类似制度。
其他领先的AI实验室——包括OpenAI、Google和Meta——一直在密切关注这场争端。许多AI领导者现在认为,他们将需要向白宫提前开放其最新模型,并在即将推出的产品信息共享方面极为主动。他们表示,让官员措手不及的风险实在太大了。
"提前通知,提前访问。我认为这些是我们听到的主要诉求,不仅来自美国,也来自世界其他国家,"加拿大AI实验室Cohere的CEO艾丹·戈麦斯本周早些时候在接受采访时表示。"我认为这在很多方面都是好事。这表明当局对这一极其重要的技术表现出了积极的参与和考量。"
这场争端本周也成为法国G7峰会上的关键议题,特朗普总统在会上表示与Anthropic的谈判"进展顺利",但未透露细节。Anthropic CEO达里奥·阿莫代伊敦促世界各国领导人抵制在AI监管方式上各行其是的诱惑。
本文仅供参考,不构成投资建议。