Anthropic 工程师都在用的“神装”,被 OpenAI “强娶”了!23 人的草台班子如何靠“搞破坏”逆袭?

温故智新AIGC实验室

TL;DR:

顶级“内鬼”工具 Promptfoo 被 OpenAI 收编,这家靠 23 个人、利用业余时间撸出来的安全神器,竟然让全硅谷的 AI 工程师(包括竞争对手)集体“上头”。OpenAI 这波收购不仅是为了补齐 Agent 的安全短板,更是把竞品家里的“防弹衣”直接变成了自家的传家宝。

就在昨天,AI 圈又上演了一出“始于兴趣,终于暴富”的逆袭神话。OpenAI 官宣收购了 AI 安全初创公司 Promptfoo,准备将其整合进自家的企业级 AI 平台 OpenAI Frontier。1

这个消息一出,隔壁 Anthropic、亚马逊和 Shopify 的工程师们估计都要集体愣神三秒:“坏了,我天天用来给模型‘体检’的工具,现在变成隔壁老王的了?”

这个仅有 23 人的团队,在过去两年里上演了一场教科书级的“降维打击”。

技术大揭秘:这玩意儿到底怎么“搞破坏”的?

故事的开头很有硅谷内味儿:Ian Webster 当时还在 Discord 带着团队搞大模型。他发现,当大家都在疯狂卷模型性能时,安全防御还停留在“石器时代”。2 传统的扫描器根本看不懂什么是“提示词注入”(Prompt Injection),也没法阻止 AI 像个喝高了的客服一样,随口向用户承诺它根本没有的打折权限。

于是,Webster 利用夜晚和周末的私人时间,自己动手撸出了 Promptfoo 的雏形。

简单来说,Promptfoo 就是一个自动化的“职业喷子”兼“高端黑客”。它不靠人工去一点点试探,而是直接派出一支 AI 智能体“红队”。

  • 模拟攻击:它会变着花样对 AI 进行“越狱”测试,看看能不能套出数据库密码。
  • 逻辑找茬:在作业辅导场景下,测试 AI 会不会突然发表过激言论。
  • 压力测试:模拟各种极端用户行为,直到模型“破防”。

最绝的是,它能通过智能体推理循环,不断迭代优化攻击手段。这种“用 AI 打败 AI”的思路,直接击中了开发者们的痛点。毕竟,谁也不想在睡梦中被“AI 智能体反水”的消息惊醒。

行业“地震”:谁笑了,谁哭了?

Promptfoo 的崛起速度,快得让一众大厂汗颜。在正式商业化之前,就已经有 2.5 万名工程师偷偷用上了。到目前为止,它的开发者用户超过 35 万,连《财富》500 强中都有 25% 的企业在靠它保命。3

“OpenAI 收购 Promptfoo 释放了一个极其明确的信号:AI 智能体要进车间、进银行、进核心业务,安全不再是加分项,而是生死线。”1

对于 OpenAI 来说,这波操作堪称一箭双雕。一方面,它的 Frontier 平台正试图把 AI 变成企业的“AI 同事”,如果这些同事动不动就泄露内部工单,那生意就没法做了。收购 Promptfoo,相当于给这些还没满月的 Agent 请了个顶级保镖。

另一方面,这也是一次精准的“降维打击”。Promptfoo 可是支持对比测试 ChatGPT、Claude 和 Gemini 等多种模型的。4 虽然 OpenAI 承诺会保持其开源属性并支持多种供应商,但正如网友调侃:“以后你用 Promptfoo 测试 Claude 的漏洞,OpenAI 可能在后台笑得最大声。”

未来预测:安全工具会是下一个“金矿”吗?

随着 OpenAI 收购 Promptfoo,AI 安全赛道的“军备竞赛”正式进入白热化。

目前,头部的 AI 玩家都在疯狂加码:

  1. OpenAI:一手抓收购,一手推自研,比如上周刚发布的漏洞修复 Agent——Codex Security。2
  2. Anthropic:走的是“精英自研”路线,利用 Claude 4.6 的推理能力直接扫描代码库,主打一个上下文感知的深度体检。2

我们可以预见,未来的 AI 开发流程将发生质变。以前是“先上线,出事再补”,现在是“不上红队,不准发布”。

对于那些还在深夜撸码的开发者来说,Promptfoo 的故事无疑是一剂强心针。谁说业余时间随手撸的项目不能改变世界?只要你找准了那个让巨头们都感到“后怕”的痛点,OpenAI 的支票可能就在路上了。

引用


  1. OpenAI to acquire Promptfoo · OpenAI · OpenAI News (2026/3/11) · 检索日期 2026/3/11 ↩︎ ↩︎

  2. OpenAI acquires Promptfoo to secure its AI agents · TechCrunch · Kyle Wiggers (2026/3/11) · 检索日期 2026/3/11 ↩︎ ↩︎ ↩︎

  3. OpenAI收購AI安全測試工具Promptfoo,強化代理人安全評估能力 · iThome · 黃彥棻 (2026/3/11) · 检索日期 2026/3/11 ↩︎

  4. OpenAI acquires Promptfoo to strengthen AI agent security · The Next Web · Thomas Macaulay (2026/3/11) · 检索日期 2026/3/11 ↩︎