白宫要求Anthropic阻止两款模型的所有越狱攻击，这是一项不可能完成的任务

特朗普政府正要求Anthropic阻止其最先进AI模型的所有可能越狱攻击——这一技术上的不可能要求已使双方在AI监管的未来问题上陷入僵局。

据一位白宫高级官员和另一位熟悉情况的行政官员透露，白宫正要求Anthropic消除其Fable 5和Mythos 5模型中的所有可能安全漏洞，这一技术上无法达到的标准已升级为一场围绕AI监管未来的僵局。

"问题在于，白宫一直处于这种极端的反监管姿态，而现在他们正面临人们多年来一直预测的真正AI能力，"一位前白宫技术官员表示，他要求匿名以免影响职业关系。"本应早有准备和政策来系统性地应对这一问题，管理好收益和风险，但结果却是这种草率行事的方式，让AI行业陷入了真正的困境。"

这场争端爆发于白宫于6月13日对Anthropic实施出口管制，迫使该公司暂停所有用户对这两款模型的访问。亚马逊CEO安迪·贾西曾警告财政部长斯科特·贝森特，研究人员发现了防护栏被绕过的证据。Anthropic辩称该漏洞是有限的，并不构成有意义的安全缺陷，但政府回应称禁止外国用户访问这些模型。该公司选择完全撤下这些模型，声称这是遵守出口管制的唯一途径。

这场僵局涉及重大的经济利益。Anthropic的企业客户——包括苹果、Meta以及大量《财富》500强企业——仍无法使用该公司最先进的系统。这场争端也冻结了该公司部署新模型的能力，可能减缓其收入增长及相对于竞争对手OpenAI和Google DeepMind的竞争地位。

争端核心的技术不可行性

安全研究人员和AI高管表示，白宫的要求在当前技术条件下无法实现。由于大型语言模型是概率性而非确定性的，公司无法保证它们对任何给定提示词会生成什么内容。每个模型都可以在不同程度上被越狱，而完全解决这一问题在现有方法下并不可行。

Anthropic和独立网络安全研究人员认为，越狱并非一个可以单独修补的孤立问题。该公司最初的辩护是，没有任何AI模型可以完全免疫黑客攻击——这一立场激怒了白宫官员，他们指出Anthropic多年来一直在警告AI可能带来的灾难。

白宫与Anthropic之间的谈判——由公司方面负责公共政策的莎拉·赫克和联合创始人汤姆·布朗牵头——已转向制定一套共同的基准来评估未来的越狱攻击，包括防护栏被绕过的程度、被暴露的能力以及漏洞的实际后果。虽然出口管制尚未解除，但转向技术标准制定工作表明谈判正在取得进展。

事实上的许可制度正在形成

特朗普政府此前曾反对强制性的AI许可。总统特朗普上月签署了一项行政命令，为AI实验室创建了一个"自愿"系统，允许其提前提交模型供政府测试，并明确附加条款说明这不会变成强制性要求。但Anthropic争端实际上已催生了一套特设版本的类似制度。

其他领先的AI实验室——包括OpenAI、Google和Meta——一直在密切关注这场争端。许多AI领导者现在认为，他们将需要向白宫提前开放其最新模型，并在即将推出的产品信息共享方面极为主动。他们表示，让官员措手不及的风险实在太大了。

"提前通知，提前访问。我认为这些是我们听到的主要诉求，不仅来自美国，也来自世界其他国家，"加拿大AI实验室Cohere的CEO艾丹·戈麦斯本周早些时候在接受采访时表示。"我认为这在很多方面都是好事。这表明当局对这一极其重要的技术表现出了积极的参与和考量。"

这场争端本周也成为法国G7峰会上的关键议题，特朗普总统在会上表示与Anthropic的谈判"进展顺利"，但未透露细节。Anthropic CEO达里奥·阿莫代伊敦促世界各国领导人抵制在AI监管方式上各行其是的诱惑。

本文仅供参考，不构成投资建议。