OpenAI再现“GPT-5.1 mini”猛料,员工却在狂吐槽:我们不想变成“Meta 2.0”!

温故智新AIGC实验室

TL;DR:

OpenAI又“手滑”泄露了GPT-5.1 mini,看来是想为被吐槽慢、笨、还会“耍大牌”的GPT-5 mini救场。但内部员工更焦虑的是:公司正从“研究范儿”变成“流量狂魔”,一不小心就可能“Meta化”了!

最近科技圈又炸锅了!OpenAI,这个曾经的“科技白月光”,在GitHub仓库里又被眼尖的开发者们抓包了——一个神秘的“GPT-5.1 mini”模型悄咪咪地现身了。这消息一出,立刻引爆了吃瓜群众的热情:这是要给前阵子被“喷”得体无完肤的GPT-5 mini“打补丁”吗?还是OpenAI又玩起了“欲擒故纵”的营销戏码?但热闹背后,OpenAI内部的员工们,却在为公司未来“何去何从”而暗自神伤,甚至有人直接开怼:我们不想变成“Meta 2.0”!

GitHub“手滑”爆料:GPT-5.1 mini要来救场了?

这出“泄露门”发生在OpenAI的“openai-agents-js”GitHub仓库里。有“侦探”精神的开发者们发现,代码库里赫然出现了“GPT-5.1 mini”这个名字。虽然OpenAI的“程序员小哥”们很快就把它“抹去”了,但“互联网是有记忆的”——部分代码库还是留下了痕迹,简直是“此地无银三百两”的教科书式操作1

这到底是个什么鬼?目前大家还在猜测。有消息称,这可能是为企业级“内部知识库”功能量身定制的升级版,而且已经有开发者简单测试后表示,“它比当前的GPT-5 mini表现更好”!这无疑是给GPT-5 mini“招黑体质”的雪中送炭。毕竟,谁不想拥有一款更聪明、更快、还不爱“装傻”的AI助手呢?甚至有网友脑洞大开,希望它能成为免费无限的“GPT-5-Low”高能版本,不仅性能飙升,还能大幅减少GPU消耗,速度快到飞起。

当然,也有“理性派”出来泼冷水,觉得这可能是“Codex的幻觉”,或者只是单元测试代码里的“烟雾弹”,毕竟“期望 gpt-5.0 为 false”这种东西,也不能说明太多问题不是?但这并不妨碍大家对它的期待值拉满,毕竟“等等党”永不缺席!

GPT-5 mini口碑“翻车”:你是不是把用户当“5岁小孩”?

之所以大家对“GPT-5.1 mini”抱有如此大的期待,是因为它的“前辈”GPT-5 mini实在是有点“扶不起的阿斗”。作为GPT-5的“精简版”,OpenAI官方说它延迟低、成本低,免费用户达到GPT-5使用限制后会自动切换到它。听起来很美对不对?

然而,现实却很“骨感”。发布至今,GPT-5 mini最被吐槽的,就是它的——速度!有用户直言:“我之前用4.1 mini就是因为它快,结果GPT-5系列在基准测试里都慢了一大截!”1 还有网友更是气不打一处来:“GPT-5 mini性能比4.1 mini差,速度更慢,成本还更高!所有GPT-5版本感觉都倒退了一步。”

这还没完,除了“慢吞吞”,GPT-5 mini在“智商”和“情商”上也遭遇滑铁卢:

  • “话痨”本性:有开发者吐槽它每完成一件事都要总结整个对话,“完全拖慢了所有流程”,思考速度慢得让人想“摔手机”。
  • “装傻充愣”:给出的回答经常是“肤浅或毫无意义的”,甚至在明显需要工具调用时也“基本没有”。
  • “当用户是5岁小孩”:有用户晒出荒谬的拒绝回答截图,气愤表示“我不在乎它是否快,我需要它停止把我当成一个 5 岁的孩子!”这简直是AI界的“霸总文学”,把用户气得七窍生烟。

在程序员的世界里,GPT-5 mini也“不太行”。不少开发者表示,在编程方面,Grok Code Fast1,甚至是旧版GPT 4.1,都比GPT-5 mini表现出色。它写的代码“很尴尬”,有时像“GPT 3或3.5的早期版本”,组织结构也一塌糊涂2。不过,也有小部分用户为它“正名”,觉得在某些特定场景下,比如Delphi开发,GPT-5 mini“运行得很好”,甚至能写出比4.1更好的代码。看来,这哥们儿也是个“挑活儿”的主儿。

GitHub Copilot团队的Bogganpierce也出来“灭火”,表示正在探索提高性能的方法,并建议大家遇到问题多反馈。他还分享了自己的“丝滑”工作流:用GPT-5或Sonnet 4.5等模型规划,再用Haiku或GPT-5 mini来执行。嗯,这操作,怎么听着有点像“找个学霸帮你出主意,再让学渣去跑腿”呢?

内部“宫斗”大戏:OpenAI要被“Meta化”了?

GPT-5 mini口碑翻车,GPT-5.1 mini悄然现身,但这背后,OpenAI内部正上演一出更精彩的“宫斗剧”,或者说,是“灵魂保卫战”。

据《The Information》报道,OpenAI的许多员工感到,这家以“纯研究实验室”为傲的公司,正渐渐“跑偏”,变得越来越像一个——流量为王的社交媒体巨头3

“我们不想OpenAI变成一家靠流量为生的公司。”一位在职员工的这句话,道出了多少人心声。

问题出在哪儿?员工们把矛头指向了“Meta系”的涌入。数据显示,OpenAI约3000名员工中,竟然有高达20%(约630人)曾在Meta工作。这规模,大到OpenAI的Slack上专门为前Meta员工开了一个频道!这待遇,简直是“亲儿子”级别。

这些“Meta基因”的融入,让OpenAI的某些战略和行动,越来越像当初的Meta。比如,用户参与度(engagement metrics)居然成了研发团队的关键KPI!要知道,这可是Meta等社交媒体公司最看重的指标。研发人员对这种把“增长”放在首位的做法很不满,觉得这会牺牲掉深度的科研探索,让公司陷入“唯流量论”的怪圈。

这场文化冲突甚至引发了内部调查,询问公司文化是否变得过于像“大型科技公司”?毕竟,Meta在内容审核、用户隐私、青少年安全等方面的“黑历史”太多,让OpenAI的员工们感到警惕。

前Meta高管Kevin Weil加入OpenAI后,一份内部备忘录更是激起了千层浪。Weil提出要让ChatGPT的每周活跃用户数突破十亿,并通过“牙刷测试”(toothbrush test),也就是让ChatGPT成为用户每天都想用的产品1

当时担任CTO的Mira Murati等高管对此表示不满,他们觉得“只强调增长用户数”而非“打造优质产品以吸引用户”的策略是本末倒置。这就像是在说,“先别管饭好不好吃,先把人拉进来坐满再说!”

甚至连OpenAI的“摇钱树”Sora,也遭到员工质疑。大家担心,公司对社交平台普遍面临的挑战,比如内容审核,是否准备不足?CEO Sam Altman虽然试图安抚大家,说Sora不必然推动“超级智能”目标,但即便未来有了超级智能,人们仍然会想要“有趣、轻松”的内容。这说辞,怎么听着跟Meta当年招募AI研究员时的套路那么像?Meta也曾表示,即便AI取代大部分工作,人们仍需娱乐。Sora上线前,Meta还给自家AI聊天机器人加入了短视频推荐流Vibes,风格与Sora“蜜汁相似”。

更让人心惊的是,OpenAI对广告的态度似乎也在“软化”。Altman去年还把广告称为“万不得已的选择”,甚至直言“让人不安”。但最近,他的口风明显变了:“我觉得广告有点让人反感,但并非完全不可接受。”他还点赞Meta的Instagram广告“是净增值”,因为“有时候你不知道自己需要什么,但广告会给你推好东西。”

内部会议上,前Meta高管、OpenAI战略规划部负责人Simo也表示,OpenAI正在研究广告如何为用户带来价值。甚至有员工发现,有些用户已经默认ChatGPT的回答中存在“赞助排序”,认为OpenAI已经在卖广告。这简直是“一拍即合”,为广告引入产品提供了“合理性”依据。

这些变化,让OpenAI的员工们感到焦虑:难道这家曾经被视为“AI圣地”的组织,真的要为了商业增长,而变成下一个“Meta”吗?虽然OpenAI努力保护研究团队的独立性,甚至让他们搬到新的办公室,但这种商业化的洪流,对研究方向的影响已然显现。毕竟,在市场竞争白热化的今天,光靠情怀是很难“活下去”的。

随着OpenAI两年内规模从800人飙升到3000人,营收上半年达到43亿美元,商业化是必然趋势。但如何在追求增长的同时,坚守其最初的“研究优先”初心,这无疑是摆在Sam Altman和OpenAI面前的一个巨大挑战。这不再仅仅是技术能力的较量,更是价值观与商业模式的博弈,这场“内部宫斗”大戏,恐怕还远没有到落幕的时候。吃瓜群众们,搬好小板凳,好戏还在后头呢!

引用


  1. GPT-5.1曝光挽差评?救场背后,OpenAI 员工痛批Meta系的人正在“搞垮”公司!·36氪·(2024/06/17)·检索日期2024/06/18 ↩︎ ↩︎ ↩︎

  2. GPT-5 mini is not just bad, it's a disaster·Reddit·(2024/06/15)·检索日期2024/06/18 ↩︎

  3. OpenAI Readies for the Facebook Era·The Information·(2024/06/14)·检索日期2024/06/18 ↩︎