2万美元买个“赛博编译团队”?16个Claude智能体两周手搓10万行代码,程序员:这波汗流浃背了!

温故智新AIGC实验室

TL;DR:

16个Claude分身、2周时间、2万美元,换来一个能跑《毁灭战士》的C语言编译器。Anthropic研究员这波“钞能力”实验证明:未来的大神可能不再手敲代码,而是转型成为管理16个AI分身的“赛博工头”。

最近,AI圈又整出了一个足以让程序员群体集体失眠的“狠活”。Anthropic的研究员Nicholas Carlini没雇一个活人,而是让16个Claude Opus 4.6智能体(Agent)“组团”开黑,在完全没有人工干预的情况下,从零开始用Rust语言构建了一个功能完备的C语言编译器。1

这事儿最离谱的地方不在于它写了代码,而在于它写了整整10万行代码,而且成品强得可怕:不仅能编译Linux 6.9内核,支持x86、ARM和RISC-V架构,甚至还能顺手跑起经典的《毁灭战士》(Doom)。2

赛博“工头”上线:不招人,只招Claude分身

既然是团队协作,那这16个Claude是怎么分工的?Carlini并没有给它们配一个“智能体经理”,而是玩了一手高度的自主化。

他把这些Claude扔进了一个简单的循环里,让它们住在独立的Docker容器里,共享同一个Git仓库。为了防止大家“撞车”改同一行代码,Carlini设计了一个相当接地气的“排队上厕所”机制:

  • 任务锁定:Claude想干活时,得在特定目录下写个文本文件来“锁定”任务。1
  • 分工明确:虽然没有硬性分配,但这些智能体自己慢慢演化出了专业分工。有的专攻文档,有的死磕代码质量。
  • 自主冲突解决:遇到代码合并冲突(Merge Conflict)这种让无数新手程序员头大的问题,Claude居然能自己商量着搞定。1

调侃式点评:这种“无领导小组讨论”式的开发模式,最大的优点可能就是没有PPT周报,也不会因为“谁该接这个需求”在会议室打起来。

烧钱如流水:2万美元的“作业”香不香?

虽然听起来很酷,但这波操作的“含金量”也是真的高——这里的金是真金白银。为了产出这个编译器,项目一共进行了约2000次会话,消耗了近20亿个Token,最终给Anthropic上贡了**2万美元(约合14万人民币)**的API费用。3 4

面对这笔巨款,网友们的反应也是两极分化。 一方觉得这是史诗级的突破,证明了AI Agent在处理长期、复杂任务上的极限;另一方则开启了毒舌模式。微软前高管Steve Sinofsky就直接开怼:有人吹嘘Claude两周干了人类37年的活(指GCC编译器的历史),这纯属扯淡。GCC早在1987年就能用了,这37年是在持续进化,而不是难了37年才写出来。1

更有网友尖锐指出:

“花了2万美元,最后输出的却是训练数据里早就存在的代码?这波属于是‘高价复印机’了。” 1

未来预测:程序员的终局是“监考老师”?

Carlini本人对这个编译器的态度倒是挺谦虚,称其为一个“有趣的成果”。他认为更深远的意义在于验证了**“如何为长期自主运行的智能体设计控制框架”**。1

这意味着,未来“10倍开发者(10x Developer)”的定义可能要变了。 以前你得是解决Bug的孤胆英雄,以后你可能得是擅长设计自动化测试体系、能同时盯着16个AI干活的“总监考官”。当模型卡死在某个逻辑死循环里时,你能制定出变通方案,这就是你的核心竞争力。1

当然,这种“大力出奇迹”的开发方式也伴随着风险。Carlini暗示,如此高效且大规模的代码生成能力如果被滥用,世界可能需要新的安全策略来应对。毕竟,如果AI能两周写个编译器,那离它写出让人防不胜防的漏洞包可能也就不远了。

引用


  1. 无人工干预,16 个 Claude 智能体联合构建出 C 语言编译器 · InfoQ · Nicholas Carlini (2026/2/8) · 检索日期 2026/2/21 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 16 个Claude AI两周写出10 万行Rust 代码,自主构建C 编译器 · 腾讯云 · (2026/2/8) · 检索日期 2026/2/21 ↩︎

  3. 16个Claude智能体用两周编写10万行Rust代码,自主打造C编译器 · 搜狐 · (2026/2/8) · 检索日期 2026/2/21 ↩︎

  4. Anthropic公司Claude Opus 4.6模型花费两万美元尝试编写C编译器 · 网易新闻 · (2026/2/8) · 检索日期 2026/2/21 ↩︎