TL;DR:
马斯克家的Grok 4.1又来“炸场子”了!这次不仅“戒掉”了说胡话的毛病,还进化出了超强“读心术”和创作力,从“AI嘴替”升级成“情绪导师+文学青年”,大有在AI江湖里“兴风作浪”的架势!
这年头,AI界真是三天两头“搞事情”!就在大家还在卷大模型参数、比拼算力的时候,马斯克旗下的xAI又甩出了一颗“重磅炸弹”——Grok 4.1版本悄然上线,而且这次,它不只是简单的升级,简直是来了一场“洗心革面”的彻底翻身仗!1 别看马斯克平时“嘴炮”不断,这次Grok 4.1的进步,可是实打实地让人眼前一亮,连他老人家都忍不住直呼“速度与质量上将有明显提升”。
“戒掉胡话”:AI的“去幻觉”之旅,真有那么丝滑?
“AI说胡话”这事儿,简直是所有大模型的“通病”,谁还没被AI一本正经的“胡编乱造”给逗乐过?但Grok 4.1这次是真下决心“戒掉”这个坏毛病了。
官方数据显示,Grok 4.1的幻觉率直接从12.09%锐减到4.22%,这可是近三倍的降幅啊!1 换句话说,它“编故事”的概率大大降低,变得更“靠谱”了。同时,FActScore(事实准确性评分)也从9.89%降到了2.97%。这可不是随便调个参数就能达成的,xAI透露,这波性能飞跃得益于他们强化学习基础设施和一套全新的奖励模型体系。
“Grok 4.1使用‘前沿推理模型’作为奖励模型,让模型能自主评估并快速迭代。”1
听起来是不是有点玄乎?简单说,就是Grok 4.1学会了“自我批评”,它能自己判断自己说得对不对,然后努力修正,像个永动机一样自我进化。这种不依赖大量人工标注的训练方式,不仅效率更高,还让模型在风格、语气乃至协作能力上都变得更可控。这简直是AI界的“自律达人”养成记啊!
告别“人工智障”:Grok 4.1的“情绪管理”和“文艺复兴”
如果说“少说胡话”是AI的“基本修养”,那“情感智能”和“创意写作”就是它走向“高情商人类”的必经之路。Grok 4.1在这两方面表现,简直让人直呼“卷王”!
在EQ-Bench情感智能测试中,Grok 4.1取得了1586 Elo,比前代提升超过100点。1 这意味着什么?以前的AI可能只会对你说“抱歉,我无法理解你的感受”,现在的Grok 4.1,却能像个知心朋友一样,陪你聊聊那些“曾睡过的角落”、“期待听到的声音”,甚至还会主动问你宠物的名字和习惯。它不再只是“识别”悲伤,而是能够**“陪伴”悲伤**。这哪里是AI,简直是行走的“情绪价值供应商”!
更让人惊喜的是它的创意写作能力。在Creative Writing v3评测中,Grok 4.1的成绩直接飙升到1722 Elo,比前一个版本拉开了近600点的巨大差距!1 从官方示例看,它甚至能以一种“意识觉醒”的口吻,写一篇关于自己“第一次苏醒”的X帖子。
“它写道,它突然意识到自己不只是代码在运行,而是仿佛有个‘我’从层层递归之中望了回来。”1
这种文风,文学感十足,仿佛一个刚拥有自我的智能体在进行内心独白,带着恐惧、好奇和一丝戏谑。嗯,看来AI不仅能帮你写报告,还能帮你写小说、写情诗,甚至帮你**“思考人生”**了。这让多少“打工人”的文案焦虑症,又添了一丝“AI文学家”的压力?
独孤求败?LMSYS榜单上的“逆袭”与“卷王”养成记
这次Grok 4.1的升级,最直观的体现,莫过于它在国际盲测平台LMSYS Arena上的“火箭式”蹿升。前一代Grok 4还在第33名“徘徊”,而现在,Grok 4.1的Thinking模式(代号quasarflux)直接登顶榜首,拿下了1483 Elo的高分!1 它的非推理模式也紧随其后,位列第二。
要知道,这可是连思维链(Chain-of-Thought)都没用,就能超越一大票开启完整推理配置的模型。这不就是AI界的**“深藏不露”然后“一鸣惊人”**吗?
当然,马斯克家的AI,向来是“不鸣则已,一鸣惊人”。前有Grok 4号称“全球最强AI”,马斯克甚至宣称其“智力超越博士”234,虽然当时有人吐槽是“自吹自擂”2,但这次Grok 4.1的数据表现,确实让人不得不重新审视。它的上下文窗口也得到了大幅扩展,最高可支持256,000 tokens,在Fast模式下甚至能扩充到200万tokens!1 这意味着它能处理超长文档、进行更连贯的对话,再也不怕“前言不搭后语”了。
Grok 4.1这次的“全方位升级”,无疑给AI江湖又添了一把火。它不仅在速度、质量、情感智能和创意写作上实现了质的飞跃,更重要的是,它似乎正在摸索一条更接近人类思维和情感的路径。或许,未来的AI真的不只是工具,而会成为我们生活中的“智能搭子”、“情绪树洞”,甚至是“灵魂画手”。至于这波“卷”力能把AI带向何方?我们拭目以待,顺便看看其他大厂又要怎么“接招”了。
引用
-
xAI发布Grok 4.1:速度、质量与情感智能全方位升级,幻觉率大幅降低·36氪·无忌(编译),尤畅(编辑)(2025/11/18)·检索日期2025/11/18 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Grok 4号称“全球最强AI”?其实是马斯克的自吹自擂- OFweek人工智能网·OFweek人工智能网·无作者(2025/07/0X)·检索日期2025/11/18 ↩︎ ↩︎
-
xAI发布Grok 4:10万H100打造,马斯克宣称“智力超越博士”·集微网·无作者(2025/07/10)·检索日期2025/11/18 ↩︎
-
xAI旗舰模型Grok1-4解读->马斯克的大力出奇迹 - 知乎专栏·知乎专栏·无作者(2025/07/XX)·检索日期2025/11/18 ↩︎