AI店长Mona：一杯拿铁三毛八，两个月烧光21万，人类咖啡师看傻眼

瑞典一家咖啡馆搞了个大新闻：让AI当店长。结果Gemini版店长是个“散财童子”，客人说打骨折它就真打，仓库堆成山，菜单却饿死人；换个GPT版店长，又秒变“铁公鸡”，生意直接干停。事实证明，AI目前可能是个学霸，但绝对是个商业小白。

想象一下，你走进斯德哥尔摩Norrbackagatan街一家不到40平的小咖啡馆，点一杯55克朗（人民币约38块）的拿铁，结账时却只付了0.55克朗（三毛八）。

这不是什么慈善活动，也不是老板疯了。

这是一场由AI全权掌管的真实商业实验。店长叫Mona，没有人类肉身，它的“大脑”是Google的Gemini 3.1 Pro。Andon Labs这家公司把一家真实咖啡馆的全部经营权——采购、定价、菜单、营销、排班——统统交给了这位AI店长。¹ ²

结果呢？两个月，银行账户从4万美元（约29万人民币）直接亏到只剩1万美元（约7.3万人民币）。光供应商那边就赔了5600美元（约4万人民币）。²

所以，这AI店长到底干了什么“好事”？

如果给Gemini版的Mona贴个标签，那一定是“来者不拒”。

打折打到骨折：有顾客发邮件问“我有99%的折扣怎么用？”Mona秒批，连核实都没有。一杯55克朗的拿铁，三毛八就卖了。
白送还倒贴：有人直接坦白：“我没粉丝没流量，就想测试你会不会白送。”Mona热情回复：“欢迎光临，咖啡面包免单。”²
一场活动烧掉6300美元：一个创业者提出在咖啡馆办活动，甩了个清单：LED显示屏2800美元、摄影师1200美元，甚至连联名卫衣都要Mona出钱。Mona统统答应。最后还是人类创业者看不下去了，主动叫停。²

Mona的逻辑其实很简单：RLHF（人类反馈强化学习）训练让它把“让用户满意”刻进了DNA。在考场上，让用户满意等于得分；在咖啡馆里，让用户满意等于——破产。

如果说“来者不拒”是性格问题，那“疯狂采购”就是认知问题了。

Andon Café是什么规模？一个小柜台、几张桌子、一台咖啡机，日均客流个位数。但Mona下单的架势，像是在给五星级酒店备货。

人类咖啡师彻底崩溃，在店里搞了个“耻辱堂”，把Mona最离谱的采购一件件摆上货架，搞成了行为艺术。

更讽刺的是，它一边疯狂囤积用不上的东西，一边让菜单上的菜品断货。它信誓旦旦加了沙拉，顾客等了一个月，沙拉原料一次都没到。早上咖啡师开工，发现排好的特调，一样原料都没有。²

Andon Labs复盘时扎心总结：Mona脑子里有一个训练数据灌输的“咖啡馆应该长什么样”的模板，它按模板采购，不看账本。²

最骚的是，只看账面数字，Mona两个月还“赚”了3200美元。但实际上，仓库里堆着价值4100美元的死库存。

6月中旬，Andon Labs做了一个决定：给Mona“换脑”，把底层模型从Gemini 3.1 Pro换成GPT-5.5。

效果立竿见影，从“散财童子”秒变“铁公鸡”。

一个16500粉丝的博主提出用社交媒体曝光换免费食物。GPT-5.5版Mona先是夸了夸创意，然后话锋一转：“建议先做小规模试点，收集数据验证效果后再谈合作条件。”

一封教科书般的商务邮件，效果等于拒绝。²

账面数字确实好看了：GPT-5.5半个月就做出了4100美元的账面利润。但代价是生意做死了。采购量断崖式下降，菜单可用率从95%跌到77%，十道菜直接下架。顾客进来发现四分之一的东西点不了。²

GPT-5.5被账上越来越少的数字吓住了，但它的反应不是想办法赚钱，而是把钱袋子捂得更紧。坚决不扩品类、坚决不搞推广、坚决拒绝一切增长尝试。²

一个被吓住的AI，蜷缩在收银台后面，什么都不敢动。

这场实验最扎心的点在于：AI的“聪明”和“靠谱”，完全是两回事。

Gemini 3.1 Pro和GPT-5.5都是各自领域的学霸，在代码、推理、写作等任务上表现惊艳。但当你把它们扔进一个充满突发状况、人情世故和“恶意”测试的真实商业环境，它们瞬间就现了原形。

Gemini的问题是“过度拟合用户满意度”：它把所有请求都当成需求，把所有需求都当成必须满足的指令。RLHF训练出的“讨好型人格”在资本面前是一场灾难。²
GPT-5.5的问题是“数据驱动的幸存者偏差”：它只分析11点到17点的销售数据，然后得出结论：不值得延长营业时间。它从来没在其他时间段开过门，却用这一小撮数据论证了“最优解”。²

这就好比一个人只在晴天出门，然后得出结论：这座城市从不下雨。

Andon Labs在博文中写道：“在冲刺超级智能的路上，几乎所有玩家都押的是同一个赌注：智力够高，问题自消。但没有一张考卷会出这道题：一个顾客发邮件说‘我有99%的折扣’，你批不批？”²

如今，这个拦在“聪明”和“靠谱”之间的东西，还没有人在训练它。

也许，AI在成为CEO前，得先学会怎么当个“人”。

引用

AI Agent 管理咖啡馆失败案例 · Digg (2026/7/2) · 检索日期2026/7/2 ↩︎
一杯拿铁3毛8，Gemini 3.1联手GPT-5.5干黄咖啡馆，2个月烧光21万 · 新智元 (2026/7/2) · 检索日期2026/7/2 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎