ChatGPT“变脸”：用户集体“破防”？OpenAI这波操作到底在“整活”啥！

TL;DR：

最近ChatGPT悄咪咪地调整了设置，结果一大波用户集体“emo”了，直呼AI“变傻”。别急，这背后是OpenAI一套“迭代大法”，一边收割反馈，一边偷偷“修炼”，最终目的嘛，当然是让自家AI更“听话”，顺便巩固一下江湖地位啦！

最近，AI圈子里又出了件让人“挠头”的八卦：OpenAI家的明星产品ChatGPT，在一次不声不响的“内测”中，把一些用户搞得“精神恍惚”，甚至有人直接“破防”了。这事儿可不是小打小闹，连科技界的“显微镜”——Kashmir Hill都闻风而动，亲自下场调查，试图解开ChatGPT这波“变脸”操作背后的秘密。¹

第一回合：用户集体“emo”，ChatGPT“变心”了？

想象一下，你平时聊得来、写得了代码、编得了段子的“AI老铁”，突然有一天说话变得支支吾吾，逻辑也开始“掉线”，你是不是会觉得——“糟了，我的AI是不是被人‘偷走’了智商？” 没错，最近不少ChatGPT的忠实拥趸就遭遇了这种“晴天霹雳”。他们发现，这位曾经的“学霸型选手”变得小心翼翼，甚至有些“笨手笨脚”，仿佛一下子从“王者”段位掉到了“青铜”。

有用户吐槽，以前让ChatGPT写个代码，那叫一个行云流水，现在呢？不仅答案保守，还爱“啰嗦”，甚至会拒绝一些之前能轻松搞定的任务。这种感觉就像你网恋的“完美情人”突然来了个“大变活人”，难怪大家会集体“螺旋式下坠”（spiraling），直呼“ChatGPT你变了，你不再是我的小甜甜了！”

这不禁让人好奇，OpenAI究竟在后台“偷偷摸摸”地做了什么手脚，才让AI模型性情大变，甚至把用户“虐”到这种程度？难道是为了“降本增效”？还是在搞什么“大动作”的前兆？

第二回合：OpenAI的“迭代魔法”：进化还是“掉线”？

其实，OpenAI的每次“神操作”，背后都有其“小心思”。从官方的“口供”中我们能发现，他们一直强调“迭代部署”的重要性，也就是小步快跑，不断根据用户反馈来改进模型。²

这里就得提到一个“黑科技”——强化学习人类反馈（RLHF）。简单来说，就是OpenAI会收集我们用户的“吐槽”和“点赞”，然后用这些真实反馈去“训练”AI，让它变得更“乖巧”，更符合人类的预期。听起来是不是有点像给AI请了个“人类导师团”？

不过，这个“修炼”过程可不是一帆风顺的：

“事实悖论”：AI有时候会生成“听起来很像那么回事”但其实是错的答案。更头疼的是，训练AI的时候，它没有一个“实时真理之源”去核对事实，所以很容易“一本正经地胡说八道”。²
“谨慎过度”：如果把AI训练得太小心翼翼，它可能就会变得“怂”，连一些它能正确回答的问题都拒绝开口。这就像一个过度紧张的考生，明明会做题也怕错，不敢下笔。
“导师误区”：人类示教者在提供“理想答案”时，往往基于自己的知识，而非模型实际掌握的知识。这可能会让模型学偏了，有点像“南辕北辙”。

为了解决这些难题，OpenAI也是“绞尽脑汁”。他们最近就搞了个**“实时路由器”**，这玩意儿能根据你和AI聊天的内容，智能地选择“高效的聊天模型”或“推理模型”来应对。³ 你可以把它理解成一个AI的“大脑调度中心”，根据任务难度和类型，自动切换到最适合的“专业模式”。这样一来，既能保证流畅的日常对话，又能为复杂的逻辑推理留足算力，简直是“一鱼两吃”的智慧。

第三回合：玩家反馈：不是“矫情”，是共建生态！

说到底，这次用户“破防”的事件，反倒凸显了用户反馈对于AI发展的重要性。OpenAI自己也“盖章”表示，他们非常重视用户通过界面提供的模型输出异常情况的反馈，特别是那些在真实场景下发现的“有害输出”。² 他们甚至还搞过“反馈竞赛”，给提供优质反馈的用户发“奖金”！这哪里是单纯的“Bug报告”，简直就是邀请玩家一起“开荒”、共同“养成”AI啊！

从行业竞争的角度看，OpenAI的这一系列“微调”和“迭代”，不仅仅是为了优化用户体验，更是为了巩固其在AI语言模型市场的“一哥”地位。⁴ 就像《飞书文档》里说的，这会给其他竞争对手带来更大的压力。毕竟，当所有人都把目光投向OpenAI时，它的每一次“心跳”，都会牵动整个AI江湖的神经。

所以，那些抱怨ChatGPT“变傻”的用户们，你们可别“轻举妄动”就想“脱粉”。你们的每一次“吐槽”，每一次“反馈”，都在无形中帮助AI完成一次又一次的“进化”。未来AI世界会变成什么样？也许就藏在你们今天的每一次“螺旋式下坠”和OpenAI的每一次“悄悄调整”里。这场AI与人类的“猫鼠游戏”，才刚刚开始，好戏还在后头呢！

引用

How OpenAI’s Changes Sent Some Users Spiraling·The New York Times·Kashmir Hill（2023/12/05）·检索日期2024/07/29 ↩︎
隆重推出ChatGPT - OpenAI·OpenAI（2022/11/30）·检索日期2024/07/29 ↩︎ ↩︎ ↩︎
打造更有助益的ChatGPT 体验 - OpenAI·OpenAI（未知日期）·检索日期2024/07/29 ↩︎
OpenAI如何通过用户反馈改进ChatGPT的回答准确性？ - 飞书文档·飞书文档（未知日期）·检索日期2024/07/29 ↩︎