AI全自动工作流？醒醒，这可能是赛博许愿池里的精神按摩

最近AI圈爆火的“Loop Engineering”号称能让AI自己干活、人类彻底躺平。但实测下来发现：写一份几十页的“AI说明书”比写代码还难，跑起来不是token火葬场就是AI越改越丑。按下启动键那一刻确实爽，但最后大概率是“钱和时间一起烧没了”——这哪是解放双手，分明是一场高级的精神按摩。

你是不是也这样？

用AI coding，最绝望的不是它啥都不会，而是它总停在一半。

项目刚起好框架，停在一半。十个bug修了三个，停在一半。上百行代码改完测试没跑，又停在一半。

而你，一个连下一句prompt都憋不出来的“无能人类”，只能对着屏幕狂吼：“继续继续！回滚回滚！让我们说中文！”

那么问题来了——有没有一种办法，能把人类彻底请出AI的工作流，让它自己从头干到尾，别再难为连豆包都不如的你了？

有的兄弟，有的。

最近，OpenClaw（龙虾）创始人Peter Steinberger和Claude Code之父Boris Cherny同时捧红了一个新概念：Loop Engineering（循环工程）。

这玩意儿简单说就是：你提前给AI写一份“无脑执行说明书”，然后啥也不用管，AI自己循环干到任务完成为止。

听起来是不是很爽？是不是觉得程序员终于可以躺平了？

但现实是——这份说明书动辄几十页PDF，里面塞满了AI实操的细节要求，堪称Prompt Engineering的Plus Ultra Pro Max版。从写代码到测试、查bug、修复、再测试……直到“所有测试通过，benchmark提升XX%”才让AI停下。

不过，作为又一个横空出世的AI黑话，大多数人对Loop Engineering的态度是——怀疑。

有人觉得它看似简单，实操难如登天；有人担心燃烧的token，试错一次原地破产；还有人说这不过是新瓶装旧酒，这些概念以前软件开发早有了。

为了验证这到底是新玩法还是真炒作，我们干脆动手搭了一个Loop Engineering项目来跑一跑。

### 实测：启动键一按，心就飞了，然后……

实验目标很简单：让AI用各种方法调教Stable Diffusion v1.5，让它的图片生成更稳定、更好看。

工具方面，我们选了开源编程Agent OpenCode，接上DeepSeek V4 Pro来改代码。测试部分引入第三方模型Qwen 3.5 Plus来评价图片质量，保证公平。

接着我们和GPT老师三轮对话，搓出一份几十页的AI说明书。整个过程就是：DeepSeek改模型→生图→Qwen锐评→DeepSeek根据评语继续改、继续调。

一切准备就绪，我深吸一口气，自信满满地按下了启动键。

那一刻，真心有种“AI牛马替我打工”的快感。闭上眼睛，仿佛已经看到了一堆精美图片自动生成。

然而，现实给了我一记响亮的耳光。

给大伙看看最终实验结果之一——同样的提示词下，Loop后的图还不如Loop前。原本还能看，跑完20轮后直接崩成了抽象艺术。

第一坑：写一份合理的“AI说明书”，难到让你想摔键盘。

人能处理的信息带宽有限，几十页的文档里，调优手段可能设置不合理，终止条件可能没想周全。任何一个细节没处理好，都会导致大量时间和token的浪费。Loop半天一查报告——哎嘿，开始就错了。

我第一次实验跑了一小时，第二次跑了五小时，结果都很一般。钱和时间烧了，图片反而更丑了。¹

第二坑：没有中途调整机会，AI很容易越走越偏。

传统的人机prompt回合制虽然烦，但至少人还能一轮一轮盯着看。图崩了，可能是参数没调好；手崩了，就改改prompt——主打一个对症下药。

但Loop Engineering的核心是提前把规则写死，然后让AI在规则里自己循环。一旦中间哪里出了岔子——比如评价模型不太聪明，把“画面不够精致”当成主要问题——DeepSeek就可能一轮轮加柔光、加细节、加色彩，最后反而人物失真。人类没有任何插手纠错的机会。²

第三坑：适用范围非常有限，不是啥项目都能Loop。

如果我们每次生成一张图片需要半小时，用Loop来迭代拼运气，显然不划算。一般来说，Loop Engineering只适合那些测试目标明确、迭代验证迅速、错误代价低、上下文不太复杂的任务。比如自动修CI、批量改代码规范之类。

我只能说——按下启动键的那一刻真的很爽。

带着一种盲目的信任，把所有压力抛给AI，不用盯着干活，不用动脑子，坐等结果和报告。这绝对是每一个开发者的梦想。

但问题是，这玩意儿实在太不可控。如果你有无限token、无限算力，可以同时开一堆炉子赛博炼丹，那也许有机会短时间炼出一个好结果。³

可对于普通人来说——stop，请立刻停止你充值token的手。

网上已经有无数开发者吐槽：“你们这些大佬有无限token供应，我们20美元的套餐怎么可能撑得住？”⁴ Peter Steinberger本人对此也只能回一句：“难道你的时间真不值钱吗？”——好家伙，这话听起来就像“何不食肉糜”。

还有人指出，调试一个已经跑了47轮的状态机，比修好一个prompt难10倍。⁵ 大多数开发者连可靠的一次性prompt都还写不好，直接上Loop无异于让一个刚学会走路的孩子去跑马拉松。

Loop Engineering确实代表了一种美好的愿景——让AI真正自主工作，人类彻底解放。但现阶段，它更像是一场“按下启动键时的颅内高潮”：你想象中AI在辛勤劳作，实际上它在悄悄烧你的token、生产一堆垃圾输出。

如果你有充足的预算和强大的容错能力，可以一试。但对于绝大多数普通开发者和企业来说——别被“全自动”这个词忽悠了，先把手头的prompt写好，把Harness搭好，再考虑Loop吧。

毕竟，真正的解放，从来不是从劳动中抽身，而是找到正确的方式去劳动。