白宫AI新令盯错了风险:网络安全的幌子下,谁来管生物与化学?

封面图

特朗普政府6月2日签署的AI行政令,被包装成美国AI监管的里程碑式文件。白宫宣传的核心卖点是”前沿模型网络安全框架”——政府可以提前30天审阅最强AI模型,企业自愿提交,司法部协同打击AI驱动的网络犯罪。读完全文却让人怀疑:这份长达数百页的行政令,是不是又一次精心挑选了最容易管理的风险,把真正难啃的骨头留在了桌上。

行政令最显眼的部分,是它对前沿模型网络安全能力的强调。命令要求AI企业在发布”covered frontier model”前,给政府留出30天窗口用于安全评估。配套机制是一个自愿参与的”前沿模型论坛”,由国土安全部牵头,参照CISA的Secure by Design承诺做架构。这套设计看似合理:政府不强制、不立法、不卡发布节奏,只换信息和早期访问权。对于正打算IPO的Anthropic、OpenAI、SpaceX来说,这是最不坏的结果。甚至有分析认为,这是特朗普政府有意放松监管、给行业”发糖”。

但与此同时,过去两周另一条新闻线几乎被行政令的光芒盖住:Anthropic的Fable 5和Mythos 5模型,因网络安全和生物化学相关请求的安全问题,先后被暂停。Ars Technica报道,Fable 5的安全分类器会把涉及网络安全、生物、化学、蒸馏等领域的问题路由给更弱的Opus 4.8。BBC指出,该模型公开发布后引发巨大争议,最终被下线。Anthropic自承,他们有理由相信”有资源的恶意行为者”正在尝试用模型做不该做的事。

把这两件事并排放,会看到一个尴尬的错位:行政令盯住的是”AI帮黑客写代码”,而Anthropic自己披露的风险场景是”AI帮人造病毒、设计危险分子”。白宫把网络安全当成前沿模型的主要风险叙事,本质上是在挑一个最容易讲故事、最不容易得罪硅谷的领域。网络安全有CISA、有FBI、有现成的执法链条,监管起来有抓手;而生物、化学风险涉及NIH、FDA、CDC等多部门,跨境还有《生物武器公约》的复杂议题,行政令根本不想碰。

更微妙的是自愿两个字。行政令文本里”自愿”出现了几十次,但配套的激励是给合作企业一个”安全标签”和监管沙盒通道。换句话说,自愿的背后是隐形的市场准入压力:未来政府采购、国防订单、出口许可都会向”愿意配合”的企业倾斜。在Anthropic和OpenAI冲刺IPO的节骨眼上,这种压力比硬性立法更有效。批评者说,这是用最美国的方式——胡萝卜——做到了欧盟用大棒都做不成的事。

还有一个容易被忽略的细节:行政令给前沿模型设立了”分级基准测试”流程,但基准本身是保密的,由相关机构在60天内开发。这意味着什么?意味着OpenAI、Anthropic、xAI这些公司在提交模型时,只能相信政府告诉他们”通过”或”不通过”,但不知道具体测试了什么、用什么数据集、评分标准是什么。这种黑盒测试在网络安全领域勉强说得通,因为漏洞披露本身就有敏感性;但放在生物能力评估上就是大问题。如果一个模型在生物安全测试中被降级,企业无法对外解释为什么,也无从改进。这对企业、对学术界、对公众问责都是封闭的。

白宫讲了一个好故事:AI太强了,要让政府提前看一眼,避免坏人滥用。但故事没有讲完的部分是,看的那一眼主要在看代码能力,而不是在看待生物和化学能力。Mythos类模型已经在提示我们,前沿能力的风险重心正在从网络空间移到实体世界。行政令如果只盯着前者,等于把门锁好了却忘了窗户。这是白宫这份文件最大的盲点,也是接下来几年AI监管真正的硬骨头。

说到底,AI风险监管的难点从来不是要不要管,而是管什么、谁来管、怎么管。白宫这版答案把最容易管的那块蛋糕切走了,把最难的那块留给下一任总统。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注