TL;DR:
最近ChatGPT悄咪咪地调整了设置,结果一大波用户集体“emo”了,直呼AI“变傻”。别急,这背后是OpenAI一套“迭代大法”,一边收割反馈,一边偷偷“修炼”,最终目的嘛,当然是让自家AI更“听话”,顺便巩固一下江湖地位啦!
最近,AI圈子里又出了件让人“挠头”的八卦:OpenAI家的明星产品ChatGPT,在一次不声不响的“内测”中,把一些用户搞得“精神恍惚”,甚至有人直接“破防”了。这事儿可不是小打小闹,连科技界的“显微镜”——Kashmir Hill都闻风而动,亲自下场调查,试图解开ChatGPT这波“变脸”操作背后的秘密。1
第一回合:用户集体“emo”,ChatGPT“变心”了?
想象一下,你平时聊得来、写得了代码、编得了段子的“AI老铁”,突然有一天说话变得支支吾吾,逻辑也开始“掉线”,你是不是会觉得——“糟了,我的AI是不是被人‘偷走’了智商?” 没错,最近不少ChatGPT的忠实拥趸就遭遇了这种“晴天霹雳”。他们发现,这位曾经的“学霸型选手”变得小心翼翼,甚至有些“笨手笨脚”,仿佛一下子从“王者”段位掉到了“青铜”。
有用户吐槽,以前让ChatGPT写个代码,那叫一个行云流水,现在呢?不仅答案保守,还爱“啰嗦”,甚至会拒绝一些之前能轻松搞定的任务。这种感觉就像你网恋的“完美情人”突然来了个“大变活人”,难怪大家会集体“螺旋式下坠”(spiraling),直呼“ChatGPT你变了,你不再是我的小甜甜了!”
这不禁让人好奇,OpenAI究竟在后台“偷偷摸摸”地做了什么手脚,才让AI模型性情大变,甚至把用户“虐”到这种程度?难道是为了“降本增效”?还是在搞什么“大动作”的前兆?
第二回合:OpenAI的“迭代魔法”:进化还是“掉线”?
其实,OpenAI的每次“神操作”,背后都有其“小心思”。从官方的“口供”中我们能发现,他们一直强调“迭代部署”的重要性,也就是小步快跑,不断根据用户反馈来改进模型。2
这里就得提到一个“黑科技”——强化学习人类反馈(RLHF)。简单来说,就是OpenAI会收集我们用户的“吐槽”和“点赞”,然后用这些真实反馈去“训练”AI,让它变得更“乖巧”,更符合人类的预期。听起来是不是有点像给AI请了个“人类导师团”?
不过,这个“修炼”过程可不是一帆风顺的:
- “事实悖论”:AI有时候会生成“听起来很像那么回事”但其实是错的答案。更头疼的是,训练AI的时候,它没有一个“实时真理之源”去核对事实,所以很容易“一本正经地胡说八道”。2
- “谨慎过度”:如果把AI训练得太小心翼翼,它可能就会变得“怂”,连一些它能正确回答的问题都拒绝开口。这就像一个过度紧张的考生,明明会做题也怕错,不敢下笔。
- “导师误区”:人类示教者在提供“理想答案”时,往往基于自己的知识,而非模型实际掌握的知识。这可能会让模型学偏了,有点像“南辕北辙”。
为了解决这些难题,OpenAI也是“绞尽脑汁”。他们最近就搞了个**“实时路由器”**,这玩意儿能根据你和AI聊天的内容,智能地选择“高效的聊天模型”或“推理模型”来应对。3 你可以把它理解成一个AI的“大脑调度中心”,根据任务难度和类型,自动切换到最适合的“专业模式”。这样一来,既能保证流畅的日常对话,又能为复杂的逻辑推理留足算力,简直是“一鱼两吃”的智慧。
第三回合:玩家反馈:不是“矫情”,是共建生态!
说到底,这次用户“破防”的事件,反倒凸显了用户反馈对于AI发展的重要性。OpenAI自己也“盖章”表示,他们非常重视用户通过界面提供的模型输出异常情况的反馈,特别是那些在真实场景下发现的“有害输出”。2 他们甚至还搞过“反馈竞赛”,给提供优质反馈的用户发“奖金”!这哪里是单纯的“Bug报告”,简直就是邀请玩家一起“开荒”、共同“养成”AI啊!
从行业竞争的角度看,OpenAI的这一系列“微调”和“迭代”,不仅仅是为了优化用户体验,更是为了巩固其在AI语言模型市场的“一哥”地位。4 就像《飞书文档》里说的,这会给其他竞争对手带来更大的压力。毕竟,当所有人都把目光投向OpenAI时,它的每一次“心跳”,都会牵动整个AI江湖的神经。
所以,那些抱怨ChatGPT“变傻”的用户们,你们可别“轻举妄动”就想“脱粉”。你们的每一次“吐槽”,每一次“反馈”,都在无形中帮助AI完成一次又一次的“进化”。未来AI世界会变成什么样?也许就藏在你们今天的每一次“螺旋式下坠”和OpenAI的每一次“悄悄调整”里。这场AI与人类的“猫鼠游戏”,才刚刚开始,好戏还在后头呢!
引用
-
How OpenAI’s Changes Sent Some Users Spiraling·The New York Times·Kashmir Hill(2023/12/05)·检索日期2024/07/29 ↩︎
-
隆重推出ChatGPT - OpenAI·OpenAI(2022/11/30)·检索日期2024/07/29 ↩︎ ↩︎ ↩︎
-
打造更有助益的ChatGPT 体验 - OpenAI·OpenAI(未知日期)·检索日期2024/07/29 ↩︎
-
OpenAI如何通过用户反馈改进ChatGPT的回答准确性? - 飞书文档·飞书文档(未知日期)·检索日期2024/07/29 ↩︎