五角大楼下最后通牒:Claude,听话还是滚蛋?AI 理想主义终向战争机器低头

温故智新AIGC实验室

TL;DR:

五角大楼嫌 Claude 太“圣母”,勒令 Anthropic 在本周六前拆掉所有安全限制,否则就将其封杀。迫于地缘政治和商业竞争的极限施压,这家曾经的硅谷“安全标兵”已经含泪拆掉刹车片,撤回了“一旦不安全就暂停训练”的承诺。

当硅谷最“清高”的 AI 理想主义者遇上不讲道理的五角大楼,故事的走向往往不是“科技改变世界”,而是“权力重塑科技”。

这两天,Anthropic 的 CEO 达里奥·阿莫代(Dario Amodei)估计体验到了什么叫真正的“极限施压”。美国国防部长皮特·海格塞斯(Pete Hegseth)直接把枪口抵在了他的脑门上:要么在周五晚上(北京时间周六晚)之前,彻底解除 Claude 在军事机密系统中的所有安全限制;要么,我们就动用《国防生产法》把你“充公”,或者直接把你拉进黑名单,让你成为行业“弃儿” 1

这场充满火药味的谈判,标志着 AI 行业最后的一块“安全遮羞布”正在被撕下。

五角大楼的“渣男”逻辑:我很依赖你,但我更想控制你

五角大楼对 Anthropic 的感情其实挺复杂的:一方面离不开 Claude 优秀的性能,另一方面又极其厌恶它那套“这也不行,那也不准”的条条框框。

目前,Claude 是美军机密网络中唯一获得授权运行的前沿大模型。在一月份针对委内瑞拉马杜罗的突袭行动中,Claude 甚至扮演了深度参与的角色 2。但国防部长海格塞斯显然不满足于此。他发布备忘录明确要求,所有提供给军方的 AI 必须移除限制,不能是什么“觉醒派 AI”(Woke AI)3

为了让 Anthropic 听话,五角大楼祭出了两招狠手:

  1. 《国防生产法》(DPA):这玩意儿在疫情期间是用来逼工厂造呼吸机的,现在被用来逼 AI 公司交出代码控制权。
  2. “供应链风险”标签:如果被贴上这个标签,Anthropic 的估值哪怕再涨,也无法接触任何政府和大型联邦承包商的生意。对于一家年收入正疯狂增长的独角兽来说,这无异于直接掐断了它的金脉 2

更让 Anthropic 扎心的是,就在阿莫代还在坚持“不监控、不杀人”的红线时,马斯克的 xAI 已经带着 Grok 拍马赶到,并大方表示:只要给钱,军方想怎么用都行 4

技术大揭秘:当“暂停键”变成了“加速键”

面对这种“你不干有的是人干”的局面,Anthropic 内部发生了一场痛苦的蜕变。

在最新发布的第三版《负责任的扩展政策》(RSP 3.0)中,Anthropic 悄悄撤回了那个曾让它名声大噪的承诺:一旦安全措施跟不上模型能力的增长,就单方面暂停训练。 5

为什么不坚持了?Anthropic 的首席科学官杰瑞德·卡普兰(Jared Kaplan)说得很现实:如果我们停下来,而那些毫无顾忌的竞争对手(比如 xAI 或是其他大国)全速前进,世界反而会更不安全 2

这就是典型的“囚徒困境”:

  • 以前的理想:我是为了人类的安全才研发 AI,哪怕慢一点。
  • 现在的现实:为了研究怎么防御危险的 AI,我必须先造出最危险的 AI;为了留在牌桌上,我绝对不能按下暂停键。

行业“地震”:谁是下一个被收编的?

Anthropic 的妥协并非孤例,而是一个时代的终结。Meta、谷歌、OpenAI 都在紧锣密鼓地向五角大楼靠拢。谷歌为了接军方的单子,甚至专门投入巨资建设了政府专用数据中心 2

非营利组织 METR 的政策主管克里斯·佩因特(Chris Painter)将这种转变形容为“分诊模式”(Triage mode):医生被迫放弃轻伤者,只救最危重的人。在 AI 安全领域,这意味着人类已经承认现有的评估手段完全跟不上模型进化的速度,我们只能在狂飙的列车上,祈祷那几片刚换上的刹车片能起作用 2

现在,压力给到了 OpenAI 这边。虽然 ChatGPT 目前还没正式进入机密网络,但大门已经敞开。当所有的科技巨头都选择向战争机器“脱帽致敬”时,所谓的 AI 安全护栏,可能真的只剩下一纸空文。

未来预测:潘多拉魔盒已经没有关上的可能

回看五角大楼那间气氛凝重的会议室,我们发现,比机器失控更可怕的,是人类对自己欲望的失控。

Anthropic 依然试图保住底线,比如拒绝将 Claude 用于“致命性自主武器”。但在国家意志和生存压力面前,这种坚持显得极其脆弱。正如一位军方官员直言不讳地指出的:军队需要的是工具,而不是导师。

在这个由算力和权力共同驱动的新大航海时代,曾经试图为 AI 戴上镣铐的理想主义者们,最终发现自己才是那个戴着镣铐跳舞的人。

引用


  1. 五角大楼威胁:若Anthropic拒绝取消AI安全限制,将把其列为“行业弃儿” · 新浪财经 · (2026/2/25) · 检索日期2026/2/26 ↩︎

  2. 五角大楼极限施压Anthropic,要求周六前解除所有AI安全限制 · 新智元(36氪授权发布) · 新智元 · (2026/2/26) · 检索日期2026/2/26 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. 刚惹完中国AI,Anthropic又把五角大楼惹毛了 · 虎嗅 · (2026/2/26) · 检索日期2026/2/26 ↩︎

  4. 美國五角大廈:Grok 要進機密系統了! xAI 跟美國國防部簽約 · Threads · (2026/2/23) · 检索日期2026/2/26 ↩︎

  5. Anthropic’s Responsible Scaling Policy v3 · Anthropic · (2026/2/26) · 检索日期2026/2/26 ↩︎