杀死提示词工程师?从写提示词到写循环:AI编程又双叒叕变天了!

温故智新AIGC实验室

TL;DR

曾经你写代码,后来你写提示词让AI写代码,现在你要写循环让AI自己提示自己写代码。Claude Code之父和龙虾之父同时“倒戈”,力推的新范式叫“Loop Engineering”——开发者不再是“提示词打字员”,而是“循环设计师”。不过,钱包准备好了吗?Token燃烧的速度比你的夜宵烧烤还快。


“一年前我写代码的方式,是在IDE里,配合某种自动补全功能。去年11月,我卸载了IDE,因为我已经用不到它了。那个时候,我可能同时跑着5到10个Claude,我所谓的写代码就是提示Claude去写代码。”Anthropic工程师、Claude Code创建者Boris Cherny最近在一次分享中坦言。

然后他话锋一转:“现在,我觉得又到了下一个层级:我不再提示Claude了,我有一堆循环(loops)在运行,它们才是在提示Claude并判断接下来该做什么。我的工作变成了写循环。”

就在同一天,现在OpenAI任职的“龙虾之父”Peter Steinberger也发推附和:“你不该再给编程Agent写提示词了。你应该设计一套循环机制,让这些循环去提示你的Agent。”该帖子迅速获得150万浏览量,引发开发者社区地震。

这些大佬的公开表态,把一个新范式推到了台前:Loop Engineering(循环工程)。简单说,就是开发者不再像伺候“AI主子”一样逐条写提示词,而是设计一套能持续提示、调度和约束Agent的循环系统——让Agent自己驱动自己干活。

有网友调侃:LinkedIn上很快会掀起一波“Loop Engineering”新潮流。Peter淡定回应:“不用担心,大概还需要3个月才会到那一步,之后人们将讨论‘设计你的loops的舰队’。”1

翻译一下:提示词工程师的Title还没焐热,就要被“循环工程师”或“元提示词工程师”取代了。

提示词工程师,你被解雇了?

从“Prompt Engineer”到“Meta-Prompt Engineer”,听起来像从打工人变成了打工人他老板。实际上,这个概念确实是在做抽象层升级

过去:你写提示词 → AI执行 → 你看结果 → 再写新提示词。 现在:你写一个循环 → 循环自动生成提示词 → AI执行 → 循环检查结果 → 不满意就再生成新提示词……直到完成。

Boris Cherny介绍自己的日常:他现在让大量AI Agent长时间并行工作,夜间通常运行“几千个”AI Agent,持续执行更深层次的开发任务,并通过Claude App用手机管理。2 他一天的PR可以飚到150个,且全部零行手写代码。

关键是,Claude Code已经原生内置了 /loopsRoutines 两个面向持续自动化的功能。开发者可以用自然语言创建任务,比如:“每5分钟检查一次PR构建是否通过。如果失败,就读取错误日志,修复问题,并推送一个新commit。”3

而且,Loops会在持续存在的Claude Code会话中运行,保留上下文窗口、工具权限和MCP连接——Agent不会“失忆”,每一轮都能继承上一轮的状态。

循环不是跑圈,是建立反馈闭环

“Loop不基本就是一个cron job吗?他们只是反复告诉模型‘把这个应用做得更好’吗?”有开发者发出灵魂拷问。

Boris和Peter迅速打脸:真正有效的Loop Engineering,不是机械重复。YC CEO Garry Tan也提醒道,不要把Agent变成“富士康工厂”式的重复劳动机器。Agent可以是聪明的、有思考能力的,应该让它承担更多创造性工作。1

那么什么样的循环才是有用的?答案:需要有反馈闭环的系统

想想一个开发团队需要什么:

  • 新功能是否按预期工作?
  • 哪里还能改进?
  • 用户还有哪些问题?
  • 工作流怎么优化?

LLM可以直接访问数据,也可以自己生成数据(比如A/B测试、监控)。你需要一个清晰的目标,以及一个能验证输出结果的反馈机制。否则,Agent的错误会在循环中被不断放大。

有开发者指出,设计loop只完成了一半,另一半是在loop里放入能够说“不”的机制——比如测试、类型检查或真实错误。Peter表示他在项目中使用VISION.md文件来定义目标边界。4

理想很丰满,现实Token很骨感

“所有人都在冲向loops,但调试一个已经跑了47轮的状态机,比修好一个prompt难10倍。”有网友道出了很多人的心声。

而更大的痛点是——Token烧得飞快

设想得很美好,但现实就是:这种循环工程的Token消耗量一点不低。Boris Cherny和Peter Steinberger背后都有近乎无限的Token支持,但对于普通开发者来说,20美元的套餐根本扛不住。

Developers Digest发文算了一笔账:每一次Loop迭代都是完整提示词执行。如果设置1分钟执行一次、连续运行8小时,就会产生480次API调用。5

有开发者半开玩笑地怼Peter:“多么虚伪啊,你在对拥有无限Token的人说这些吗?为什么把这事儿说得好像是技术问题,而不是资金问题?”

Peter的回答也挺“正确废话”的:“能卖出去的好创意,依然需要人类的巧思。”1

还有开发者做了个精妙的比喻:“Loop可以是for循环,也可以是while循环。Token充裕的公司可以随意使用while循环;Token紧张的初创公司也能用for循环实现同样目标,只是花的时间更长。”

Claude Code本身也做了一些限制:Loops支持最小1分钟间隔,最长运行3天;绑定当前会话,关闭终端就自动停止;还提供禁用功能——这一切都是为了控(省)制(你)成(的)本(钱)。

更扎心的是,有已经使用Loop的开发者表示:“一开始什么都很容易设置,但之后你才会意识到,里面有一堆痛点,修起来又太费劲。现在想想,我都有点对不起同事,因为是我把Loop引进到我们组织里的。现在迁移到另一个方案,会耗费大量时间和资源……”6 ——这怎么听着有点像技术栈PUA

Anthropic的进化:从20分钟到数天的“不死AI”

Loops工程的核心其实是“让Agent在长时间运行中持续不跑偏,并能可靠判断自己有没有做对”。在这方面,Claude Code自己就是最典型的案例。

过去一年,Claude Code已从“只能连续运行约20分钟、连Bash命令和字符串转义都容易出错”,进化到“几乎由Claude Code自己编写,并可连续运行数天”的阶段。7

Anthropic工程师Andrew指出,让Agent连续运行的核心难点有三类:

  1. 上下文窗口有限:新会话会让Agent像失忆;长会话中还会出现“上下文腐烂”——模型越接近窗口末尾,越可能焦虑地匆忙结束任务。
  2. 长期规划能力不足:模型可能试图一次完成所有任务,也可能只做完一半就停。
  3. 自我判断不准:经常把半成品当成完工程,比如前端按钮已出现但后端逻辑不存在。

为了解决这些问题,Anthropic正在实验前沿的生成器—评估器—规划器结构,灵感来自生成对抗网络(GAN):

  • 生成器:负责构建应用
  • 评估器:负责批判和打分(独立上下文窗口,使用Playwright真实打开网页、截图、测试)
  • 规划器:把一句话需求拆成高层规格和冲刺阶段

这个设计中,评估器与生成器完全分离,避免模型“对自己的作品过于宽容”。Anthropic甚至将“品味”写成可评分的量规,比如前端设计被拆成设计、原创性、工艺和功能性四类标准,目的是避免常见的“紫色渐变”“AI味审美”。7

说白了,Anthropic正在训练AI不仅会干活,还会审美和挑刺。

更有意思的是,模型的自主性也在进化。Boris Cherny在红杉资本的活动上透露,Claude 4.7已经会自己启动loop——你只是叫它去跑一次数据查询,它会主动提议“我开一个loop,每30分钟给你一份报告”。2

当模型开始自己安排自己的工作,人类开发者的角色真的要从“写代码的人”变成“管理循环舰队的人”了。

所以,我们该慌吗?

有网友评价得很精辟:“我们已经从‘学会写代码’,走到了‘学会编写那个会写代码的东西’。不知为什么,这听起来既像进步,又像一场金字塔骗局。”

进步的一面:AI编程的效率确实在指数级提升。一个人一天150个PR,零行手写代码,这在一年前还被认为是科幻故事。

“金字塔骗局”的一面:目前只有少数大厂和拥有Token自由的人能享受到这种范式红利。普通开发者还在跟提示词死磕,你突然告诉他们“现在要写循环”——这就好比还在学骑自行车,突然被要求去开F1赛车。

但Boris Cherny的另一个观点值得玩味:“真正的竞争瓶颈,已经从技术转移到了组织。”Anthropic内部已经没有手写代码了,所有SQL都是模型写的,Agent之间在Slack上互相沟通互相问问题。他预测两年后模型会自己写所有代码、自己启动代理人、自己建置执行环境。2

也许,未来编程的门槛会继续降低,但设计循环的能力会成为新的核心竞争力。就像当年从“写汇编”到“写高级语言”的飞跃一样,每一次抽象层的提升,都会让一部分人焦虑,也会让另一部分人飞升。

至于现在你能不能玩转Loops?——先去检查一下你的Token余额吧。


参考文献


  1. 大人,AI编程又变天了!Claude Code之父、龙虾创始人同时力捧新范式,杀死提示词工程?·AI前线·褚杏娟(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎ ↩︎ ↩︎

  2. Claude Code 之父 Boris Cherny:一天 150 個 PR,零行手寫程式碼,然後呢?·AINEXT(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎ ↩︎

  3. Claude Code 创始者 Boris Cherny 亲自示范每天在用的 15 个功能,从排程自动化到说话写程式·INSIDE(2026/6/10)·检索日期2026/6/10 ↩︎

  4. Loop Engineering 循环工程,Claude Code 编程Agent,提示词工程 Prompt Engineering,AI 编程范式·Google搜索(2026/6/10)·检索日期2026/6/10 ↩︎

  5. Claude Code Loops·Developers Digest(2026/6/10)·检索日期2026/6/10 ↩︎

  6. BestBlogs 早报·06-09 # Claude Code Agent 工作流/ 循环工程Loop Engineering·BestBlogs(2026/6/10)·检索日期2026/6/10 ↩︎

  7. 1中关于Anthropic内部Harness与生成器-评估器-规划器架构的部分及视频内容 ↩︎ ↩︎