TL;DR
最近AI圈爆火的“Loop Engineering”号称能让AI自己干活、人类彻底躺平。但实测下来发现:写一份几十页的“AI说明书”比写代码还难,跑起来不是token火葬场就是AI越改越丑。按下启动键那一刻确实爽,但最后大概率是“钱和时间一起烧没了”——这哪是解放双手,分明是一场高级的精神按摩。
你是不是也这样?
用AI coding,最绝望的不是它啥都不会,而是它总停在一半。
项目刚起好框架,停在一半。十个bug修了三个,停在一半。上百行代码改完测试没跑,又停在一半。
而你,一个连下一句prompt都憋不出来的“无能人类”,只能对着屏幕狂吼:“继续继续!回滚回滚!让我们说中文!”
那么问题来了——有没有一种办法,能把人类彻底请出AI的工作流,让它自己从头干到尾,别再难为连豆包都不如的你了?
有的兄弟,有的。
最近,OpenClaw(龙虾)创始人Peter Steinberger和Claude Code之父Boris Cherny同时捧红了一个新概念:Loop Engineering(循环工程)。
这玩意儿简单说就是:你提前给AI写一份“无脑执行说明书”,然后啥也不用管,AI自己循环干到任务完成为止。
听起来是不是很爽?是不是觉得程序员终于可以躺平了?
但现实是——这份说明书动辄几十页PDF,里面塞满了AI实操的细节要求,堪称Prompt Engineering的Plus Ultra Pro Max版。从写代码到测试、查bug、修复、再测试……直到“所有测试通过,benchmark提升XX%”才让AI停下。
不过,作为又一个横空出世的AI黑话,大多数人对Loop Engineering的态度是——怀疑。
有人觉得它看似简单,实操难如登天;有人担心燃烧的token,试错一次原地破产;还有人说这不过是新瓶装旧酒,这些概念以前软件开发早有了。
为了验证这到底是新玩法还是真炒作,我们干脆动手搭了一个Loop Engineering项目来跑一跑。
### 实测:启动键一按,心就飞了,然后……
实验目标很简单:让AI用各种方法调教Stable Diffusion v1.5,让它的图片生成更稳定、更好看。
工具方面,我们选了开源编程Agent OpenCode,接上DeepSeek V4 Pro来改代码。测试部分引入第三方模型Qwen 3.5 Plus来评价图片质量,保证公平。
接着我们和GPT老师三轮对话,搓出一份几十页的AI说明书。整个过程就是:DeepSeek改模型→生图→Qwen锐评→DeepSeek根据评语继续改、继续调。
一切准备就绪,我深吸一口气,自信满满地按下了启动键。
那一刻,真心有种“AI牛马替我打工”的快感。闭上眼睛,仿佛已经看到了一堆精美图片自动生成。
然而,现实给了我一记响亮的耳光。
给大伙看看最终实验结果之一——同样的提示词下,Loop后的图还不如Loop前。原本还能看,跑完20轮后直接崩成了抽象艺术。
### 三大坑:Loop Engineering的赛博火葬场
第一坑:写一份合理的“AI说明书”,难到让你想摔键盘。
人能处理的信息带宽有限,几十页的文档里,调优手段可能设置不合理,终止条件可能没想周全。任何一个细节没处理好,都会导致大量时间和token的浪费。Loop半天一查报告——哎嘿,开始就错了。
我第一次实验跑了一小时,第二次跑了五小时,结果都很一般。钱和时间烧了,图片反而更丑了。1
第二坑:没有中途调整机会,AI很容易越走越偏。
传统的人机prompt回合制虽然烦,但至少人还能一轮一轮盯着看。图崩了,可能是参数没调好;手崩了,就改改prompt——主打一个对症下药。
但Loop Engineering的核心是提前把规则写死,然后让AI在规则里自己循环。一旦中间哪里出了岔子——比如评价模型不太聪明,把“画面不够精致”当成主要问题——DeepSeek就可能一轮轮加柔光、加细节、加色彩,最后反而人物失真。人类没有任何插手纠错的机会。2
第三坑:适用范围非常有限,不是啥项目都能Loop。
如果我们每次生成一张图片需要半小时,用Loop来迭代拼运气,显然不划算。一般来说,Loop Engineering只适合那些测试目标明确、迭代验证迅速、错误代价低、上下文不太复杂的任务。比如自动修CI、批量改代码规范之类。
### 那么问题来了:这玩意儿到底有啥用?
我只能说——按下启动键的那一刻真的很爽。
带着一种盲目的信任,把所有压力抛给AI,不用盯着干活,不用动脑子,坐等结果和报告。这绝对是每一个开发者的梦想。
但问题是,这玩意儿实在太不可控。如果你有无限token、无限算力,可以同时开一堆炉子赛博炼丹,那也许有机会短时间炼出一个好结果。3
可对于普通人来说——stop,请立刻停止你充值token的手。
网上已经有无数开发者吐槽:“你们这些大佬有无限token供应,我们20美元的套餐怎么可能撑得住?”4 Peter Steinberger本人对此也只能回一句:“难道你的时间真不值钱吗?”——好家伙,这话听起来就像“何不食肉糜”。
还有人指出,调试一个已经跑了47轮的状态机,比修好一个prompt难10倍。5 大多数开发者连可靠的一次性prompt都还写不好,直接上Loop无异于让一个刚学会走路的孩子去跑马拉松。
### 总结:一场高级的精神按摩
Loop Engineering确实代表了一种美好的愿景——让AI真正自主工作,人类彻底解放。但现阶段,它更像是一场“按下启动键时的颅内高潮”:你想象中AI在辛勤劳作,实际上它在悄悄烧你的token、生产一堆垃圾输出。
如果你有充足的预算和强大的容错能力,可以一试。但对于绝大多数普通开发者和企业来说——别被“全自动”这个词忽悠了,先把手头的prompt写好,把Harness搭好,再考虑Loop吧。
毕竟,真正的解放,从来不是从劳动中抽身,而是找到正确的方式去劳动。
引用
-
大家最想要的全自动工作流,可能只是一场精神按摩·差评X.PIN·莫莫莫甜甜(2026/6/24)·检索日期2026/6/24 ↩︎
-
为什么爆火的Loop Engineering才是AI全自动干活的终极模式?·优设网·数字生命卡兹克(2026/6/19)·检索日期2026/6/24 ↩︎
-
大人,AI编程又变天了,Claude Code之父、龙虾创始人同时力捧新范式,杀死提示词工程?·虎嗅网·褚杏娟(2026/6/24)·检索日期2026/6/24 ↩︎
-
Loop Engineering 火了:AI Agent 开始自己干活,公司准备好背锅了吗?·钛媒体·(2026/6/24)·检索日期2026/6/24 ↩︎
-
AI 编程进入下半场:高手已经在写Loop 了·知乎专栏·(2026/6/24)·检索日期2026/6/24 ↩︎