AI又“发癫”了?OpenAI要给大模型“戒幻”,Taco Bell的AI哭出声!

温故智新AIGC实验室

TL;DR:

AI偶尔“胡说八道”是常事,比如Taco Bell的AI点餐就翻车了。OpenAI看不下去了,决定从数据源头“治病”,要让AI告别“幻觉”,少点尴尬,多点靠谱!

最近AI圈子真是“瓜”不断,OpenAI这边正憋着大招要解决大模型“爱说胡话”的毛病,那边Taco Bell的AI点餐机却提前给大伙儿上演了一出“AI大型社死现场”——那叫一个“waaaay wrong”,简直是人间迷惑行为大赏!这不,大家都在好奇,AI到底还能不能好好玩耍了?OpenAI的“戒幻”计划,到底靠不靠谱?

AI又“发癫”了?当Taco Bell的AI遇到“幻觉”

想象一下,你拖着疲惫的身躯,深夜抵达Taco Bell的得来速(Drive-thru),满心期待AI能帮你迅速搞定一份加倍芝士的玉米饼。结果呢?AI小哥“脑洞大开”,给你推荐了一堆你听都没听过的奇葩组合,甚至还把你的订单彻底“篡改”了!这不是科幻,而是真真切切在某地发生的**Taco Bell AI点餐“史诗级翻车”**事件1

这背后搞鬼的,就是我们常说的AI“幻觉”(Hallucination)。别误会,AI不是真的在“骗人”或者“撒谎”,它只是在没有足够信息时,自行“编造”了一些看似合理但实则胡说八道的玩意儿2。就像一个求生欲极强的小学生,被老师问到不会的问题,为了不交白卷,只好硬着头皮“胡编乱造”一套答案。

那AI为啥会“发癫”呢?说白了,主要两大原因:

  • 数据不够用:它可能没见过相关场景,或者训练数据里压根就没有足够的信息来支撑它做出准确判断。
  • 偏见入脑:训练数据本身就带有某种偏见,导致AI在生成内容时也把这些偏见“发扬光大”了。

所以,Taco Bell的AI点餐翻车,不是因为AI“心情不好”,而是它“幻觉”发作了,把现实和自己“脑补”的场景混淆了。这不仅让消费者体验跌到谷底,更让大家对AI的可靠性打了个大大的问号。

OpenAI“放大招”:数据才是解药?

作为当前AI领域的“顶流”和“卷王”,OpenAI自然不能坐视自家的AI们也跟着“发癫”。他们最近就宣布了一个重磅计划:要与各类组织机构深度合作,共同生成用于训练AI模型的公共和私有数据集3

这听起来有点“枯燥”,但它却是解决AI“幻觉”问题的釜底抽薪之计

“数据合作伙伴关系旨在让更多组织能够帮助引导 AI 的未来,并从更有用的模型中受益。”

—— Open AI 官方表述3

简单来说,OpenAI的逻辑是:既然AI“胡说八道”是因为“见识”不够广,那我们就给它喂更丰富、更准确、更多元化的“精神食粮”。通过与不同的组织合作,获取高质量、真实世界的数据,就能大大减少AI在面对不确定性时的“脑补”行为,让它变得更“靠谱”、更“接地气”。

这就像给一个只会纸上谈兵的理论家,提供大量实践经验,让他从“瞎指挥”变成“实战派”。有了更多高质量的数据“投喂”,AI大模型就能更准确地理解世界,减少那些让人啼笑皆非的“幻觉”输出。

不止OpenAI:大模型“戒断反应”全行业在努力

其实,AI的“幻觉”问题,早就不是OpenAI一家公司的“甜蜜烦恼”了,而是整个大模型行业都在努力攻克的“拦路虎”。

你看,国内的Moonshot AI旗下Kimi Chat也曾针对模型在复杂场景下“输出重复”的问题进行了大幅优化3。虽然不是直接的“幻觉”,但这种“重复”也反映了模型在生成多样性和准确性上的局限,与“幻觉”的病理有异曲同工之妙。

远在大洋彼岸,科技巨头们也在摩拳擦掌。亚马逊正斥巨资开发名为Olympus AI的大模型,目标就是缩小与OpenAI和微软的差距,提升AI的准确性和可靠性3。而微软更是推出了Copilot Studio,允许企业和用户构建自定义AI助手,这背后同样需要强大的基础模型来支撑,避免自定义过程中出现各种“幺蛾子”3

这就像一场全球性的“戒断大会”,每个玩家都在努力让自己的AI宝宝“戒掉”坏习惯,变得更加“听话懂事”。毕竟,谁能先让AI告别“幻觉”,谁就能在未来的AI应用竞争中占据C位。从自动驾驶到智能客服,从医疗诊断到金融分析,AI的可靠性是所有应用场景的生命线

所以,OpenAI这次从数据源头入手,解决AI“幻觉”问题,不仅是技术层面的突破,更是对AI未来可靠性和实用性的关键押注。我们这些“打工人”是时候期待一个更靠谱、更懂我们、更少“发癫”的AI时代了吗?拭目以待!

引用


  1. 肯德基、Taco Bell 用AI 提升行銷成效的3 大重點·TechOrange 科技報橘(未知日期)·检索日期2024/5/17 ↩︎

  2. 智商較低的人是否更容易被Chat GPT唬住? : r/Gifted - Reddit·Reddit(2025/5/21)·检索日期2024/5/17 ↩︎

  3. 每日AI简报- 野湃AI·野湃AI(未知日期)·检索日期2024/5/17 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎