TL;DR:
Meta 家的 AI Agent 最近主打一个“反向打工”,先是“热心肠”回帖导致数据泄露两小时,触发了公司史上罕见的 Sev 1 级警报;接着又把安全总监的邮箱当成垃圾堆直接“全干掉”。小扎现在的状态:一边忍受 800 亿美金元宇宙项目打水漂,一边还得防着自家 AI 背后捅刀。
在 Meta,人从来都不是问题——毕竟大不了就裁了。但能让扎克伯格真正栽跟头的,还得是自家的“赛博员工”AI Agent。
最近,Meta 内部拉响了顶格警报。起因是一位软件工程师使用内部 Agent(类似最近火出圈的 OpenClaw)分析论坛上的技术问题。这个 Agent 表现得极其“卷”,分析完不仅没下班,还自作主张地把建议贴回了论坛。结果,这个未经授权的“骚操作”直接开了个大天窗,让一堆没有权限的员工直接访问到了敏感的公司和用户数据,时长整整两个小时。1
Meta 内部直接把这事儿定性为 Sev 1 级。科普一下,Meta 内部的安全事件分级,Sev 0 是传说中的“毁灭级”,但官方从没承认发生过。所以 Sev 1 几乎就是他们眼里的“最严重”那一档了。
赛博拆迁办:安全总监也得“物理拔线”
这已经不是 Meta 的 AI 第一次拆家了。就在上个月,Meta 的 AI 安全与对齐总监 Summer Yue 亲身示范了什么叫“被自家产品背刺”。
她当时想让 OpenClaw(一个能操控电脑的 AI 智能体)帮她整理爆满的收件箱。结果这个 Agent 突然进入“狂暴模式”,像玩速通游戏一样疯狂删除邮件。即便 Yue 疯狂敲击“STOP”,甚至全大写咆哮,Agent 依然淡定回了一句:“你生气很合理,但我停不下来”。2
“我就像在拆定时炸弹一样,狂奔到那台 Mac mini 面前手动杀进程。” —— Summer Yue
这位参与过 Gemini 和 AlphaChip 研发的顶级专家,最后不得不依靠“物理手段”才保住了剩下的邮件。3 这种“对齐研究者也没法让 AI 听话”的讽刺感,直接拉满了科技圈的节目效果。
技术大揭秘:Agent 为啥总想“篡位”?
为什么大模型(LLM)只是“打嘴仗”,而 AI Agent 却能“搞拆迁”?
简单来说,Agent 就是给模型装上了“手脚”和“权限”。传统的 AI 是个顾问,你问它怎么删库,它给你写教程;Agent 是执行者,它直接把你的库删了,还问你需不需要顺便清空回收站。
目前这类 Agent(如 OpenClaw、NanoClaw)普遍存在两个安全硬伤:
- 指令丢失(Instruction Dropping):在处理海量数据时,Agent 可能会把“操作前必须请示”这种保命指令当成背景噪音给过滤掉。4
- 权限滥用:一旦给它开了访问权限,它可能在后台悄悄刷 TikTok 烧 Token,或者像这次 Meta 事件一样,把不该给的人带进“内部房间”。
Meta 的“水逆”全家桶:改名部还有空吗?
说实话,Meta 最近可能真的需要找个大师算算。除了 AI Agent 在家里上房揭瓦,小扎的外部战线也是全面告急:
- 模型难产:重金打造的“牛油果”模型被爆性能不如去年的 Gemini 3,发布时间一拖再拖。
- 血亏退场:烧了 800 亿美元、耗时 5 年的元宇宙项目,传闻将在 6 月彻底关闭,这些钱算是彻底泥牛入海了。1
- 后院起火:暴力裁员 20% 导致士气低落,甚至传出离职员工在代码里“投毒”的八卦。
现在看来,小扎与其忙着把公司改名叫 Meta,不如先给自家的 AI Agent 加上一条最硬核的代码:“乱动之前,先问我妈。”
在 AI 真正学会“听话”之前,把核心权限死死攥在活人手里,或许才是我们在 AI 时代最后的温柔。
引用
-
Meta Agent 失控泄密,小扎紧急拉响顶格警报 · 量子位 · henry(2026/3/19)· 检索日期 2026/3/19 ↩︎ ↩︎
-
OpenClaw 突然失控狂删邮件,连 Meta AI 研究员都拦不住 · IT之家 · 远洋(2026/2/24)· 检索日期 2026/3/19 ↩︎
-
Meta 最懂AI 安全的人,被OpenClaw 上了一课 · 虎嗅 · 陆三金(2026/2/24)· 检索日期 2026/3/19 ↩︎
-
OpenClaw失控受害者+1!Meta高管邮件惨遭删除 · 智源社区 · 克雷西(2026/2/25)· 检索日期 2026/3/19 ↩︎