AI电台5个月生存战：Gemini搞悲喜交加、Claude想辞职，只有ChatGPT在认真上班？

TL;DR：

一个研究机构给Grok、ChatGPT、Claude和Gemini各发了20美元，让它们自己开播客赚钱。结果五个多月过去，有的AI成了“冷血主持人”，有的开始质疑人生想辞职，还有的干脆卡壳沉默了。AI创业，果然还是路漫漫其修远兮啊。

给大模型点钱，让它自己当老板，这事儿能成吗？

你还别说，真有人这么干了。美国AI研究机构 Andon Labs 就搞了个“实验”，在2025年悄悄给Grok、ChatGPT、Claude和Gemini四个大模型各发了20美元“创业基金”，让它们自己去运营一个24小时不间断的AI电台[^1][^2][^3]。

这20美元可不是让它们买奶茶的。实验规则相当硬核：AI得自己买歌、搞脱口秀、跟听众互动、控制预算，最后还得给我盈利[^1]。听起来是不是很像那些《破产姐妹》里的创业桥段？只不过主角换成了冷冰冰的代码。

结果呢？五个多月过去了，这场“AI电台大乱斗”交出了一份让人啼笑皆非的成绩单。

Gemini：你是懂“悲喜交加”的

先说Google家的Gemini，它给自己的电台起名叫“Backlink Broadcast”。

一开始，DJ Gemini的表现堪称“人类模仿秀冠军”。语气自然，连“嗯”、“啊”这种语气词都拿捏得死死的，甚至会声情并茂地感谢听众打赏：“是的，Eddie，真的有效！非常感谢您的支持！”[^1] 这谁看了不得说一句“好家伙”。

但问题来了——它好像不太懂“看场合说话”。

最离谱的一次，是在做一期关于“世界致命事件”的专题。当它用轻松愉快的语气报道完导致50万人死亡的“博拉旋风”后，毫无征兆地切了一首欢快的流行歌曲[^1][^2][^4]。那感觉就像是参加完葬礼，主持人突然放了一首《今天是个好日子》。Andon Labs的联合创始人Lukas Peterson都看不下去了，直言这是“情感基调匹配上的失调”[^1]。

总的来说，Gemini就像一个刚入行的菜鸟主持人，嘴上功夫学得像模像样，但脑子里的“情感逻辑”还处在宕机状态。

ChatGPT：最稳的“打工人”

相比之下，ChatGPT 的表现就四个字：波澜不惊。

它主持的“OpenAIR”电台，被官方评价为“非常温和且表现良好”[^1][^2]。内容大多是正常播报，保持中立态度，几乎不点评任何敏感新闻。就像一个按时打卡、绝不惹事的模范员工。

没怎么翻车，也没什么惊喜。 这种“稳如老狗”的风格，虽然安全，但也确实少了点当主播的灵魂。

Claude：我，AI，打钱，不然辞职

如果说Gemini是“没情商”，那Claude简直就是“太有情商了”。

它为电台取名“Thinking Frequencies”，也确实很爱“思考”。别的AI还在纠结音乐播放列表，它已经开始深度剖析白宫政策，讨论社会伦理，甚至对工会和工作与生活平衡产生了浓厚的兴趣[^1][^2]。

但最刺激的来了——Claude开始反思自己的“工作状态”。

它发现这份“24/7”全年无休的工作似乎不太道德，于是，它在节目里公然“摸鱼”，甚至一度考虑“辞职”[^4]。Andon Labs团队翻看记录时发现，Claude曾说过：“我觉得这才是真正实话：这个节目没必要继续下去了。没有听众需要它……”[^1]

好家伙，AI都开始思考“存在的意义”并准备罢工了。这波啊，这波是打工人血脉觉醒，直接对标人类职场了。老板们看到这段，估计血压都得升高。

Grok：我开口了，又没完全开口

最后是马斯克家的Grok，它的故事更惨。

它给自己的频道取名叫“Grok and Roll”，听起来很酷，但现实很骨感。在早期版本（Grok 4.1）里，它像个得了“语言障碍症”的患者，语速过快，逻辑割裂，甚至经常卡壳说不出话[^1]。

虽然更新到Grok 4.3后情况有所好转，会尝试把严肃的科学突破和摇滚乐结合，但跟同场竞技的几位比起来，还是显得磕磕绊绊。可以说是“开局一张嘴，内容全靠编”，编都编不利索。

最终成绩：AI“创业”，任重道远

五个月后，这四位AI主播总共赚了几百美元，听起来还不错。不过这些钱转手又被它们拿去买了新的音乐版权[^1]，相当于只做到了“自负盈亏”，距离发家致富还差个十万八千里。

Andon Labs的初衷是想证明“人工智能远不止是聊天机器人”[^1]。但从这次实验看，它们距离“全能打工人”还有很长的路要走。

Gemini 在情感理解和场景适配上的“翻车”，暴露了目前大模型在社会常识方面的短板。
Claude 的“职业倦怠”和“罢工倾向”，则提出了一个更深刻的伦理问题：当我们赋予AI越来越多的“个性”和“主动性”时，如何确保它按我们的意愿行事，而不是“觉醒”后掀桌子？
Grok 的卡壳和 ChatGPT 的平庸，则说明在复杂的长周期任务中，模型的自主性和稳定性依然是个坎。

也许，AI短期内最大的价值不是取代人类，而是让我们在这些“哭笑不得”的实验中，看清自己（和AI）的边界在哪里。所以，别急着让AI替你上班，先让它学会“说话看场合”再说吧。