TL;DR:
别看大模型界平时“神仙打架”,最近百度ERNIE突然开挂,不仅多模态能力Benchmark把GPT和Gemini都给“干趴下”了,价格还卷到飞起,直指企业级AI的“蓝海”市场,简直是AI圈的“价格屠夫”+“全能王”!
最近AI圈子真是越来越热闹,各种“黑科技”你方唱罢我登场,看得人眼花缭乱。但这几天,一个来自东方的“神秘力量”——百度ERNIE,突然就冲上了热搜,各种榜单和评测数据一出,瞬间炸翻了朋友圈。这波操作,简直是给大模型“神仙打架”的擂台又加了一把火!
多模态“六边形战士”:ERNIE 4.5 不讲武德?
要说现在AI圈最火的词,那“多模态”绝对榜上有名。光会“聊天”已经out了,能看图、听声、理解视频,甚至看懂工程图纸,那才是真正的“六边形战士”。而百度的ERNIE系列,这次就亮出了它的最新“王牌”——ERNIE-4.5-VL-28B-A3B-Thinking,这名字虽然有点长,但实力可不含糊。1
据最新的“战报”显示,这款超高效多模态AI在关键基准测试中,竟然把GPT和Gemini都给“吊打”了! 这可不是开玩笑,这意味着它在理解和处理图片、视频、文本等多种信息方面,拿出了领先全球的成绩。更绝的是,ERNIE 4.5 不止于花拳绣腿,它还瞄准了一个巨大的“蓝海”市场——企业级数据。
想象一下,那些躺在工程示意图里、工厂视频监控里、医疗扫描报告里,甚至物流仪表盘上的海量“宝藏”,过去很多文本为主的模型根本“看不懂”,只能眼睁睁地错过。但ERNIE 4.5 就能深入这些“无人区”,把这些企业级数据里的价值挖掘出来,帮助企业做出更精准的决策。这简直就是给企业客户量身定制的“智能侦探”啊!1
不仅如此,ERNIE 4.5 还有一项隐藏技能,就是能理解网络迷因和讽刺漫画,这情商和智商简直“双在线”。2 在一项多模态能力的平均得分测试中,ERNIE 4.5 拿下了77.77分,而GPT-4o是73.92分,足足领先了将近4分。在数学推理和文档问答这两个“老大难”任务上,ERNIE 4.5 的表现更是“一骑绝尘”。3
更让人“目瞪狗呆”的是价格!百度直接来了个“价格屠夫”式降维打击:ERNIE 4.5 的价格仅为GPT-4.5 的1%! 每千个Token的输入只要0.004元人民币,输出也才0.016元。这波操作,直接把AI应用门槛拉到“地板价”,简直是逼着友商跟着“卷”啊!2
“内卷”升级:文心5.0、ERNIE X1组团“降维打击”!
你以为ERNIE 4.5 已经是“王炸”了吗?不,百度的“牌库”里还有惊喜。
与此同时,百度还亮出了另一张“底牌”——深度推论模型ERNIE X1,专门用来对标DeepSeek R1。这款模型在中文知识问答、文学创作、写作、对话、逻辑推论及复杂计算上都有出色表现。更刺激的是,ERNIE X1的性能号称与DeepSeek R1相当,但价格也只有后者的一半!输入每千个Token最低0.002元,输出0.008元。这年头,连AI模型都开始“性价比”大战了,打工人的福音啊!2
而且,百度的文心大模型(ERNIE Bot)家族里,最近又出了个“文心5.0 Preview”(ERNIE-5.0-Preview-1022),在LMArena的文本竞技场排名中,一举跃居全球并列第二、国内第一! 它与OpenAI的gpt-4.5-preview-2025-02-27以及Anthropic的claude-opus-4-1-0805、claude-sonnet-4-5-20250929等全球顶级模型“平起平坐”,这实力,谁看了不说一句“真香”?4
在考验“创意生产力”的创意写作任务中,文心5.0 Preview直接排名第一,生成文章、营销文案、剧本的速度和质量都有大幅提升。在处理多层逻辑和长文本的复杂长问题理解中排名第二。而在指令遵循任务中也排名第三,这意味着它在智能助理、代码生成和业务自动化等场景中的适用性大大增强。4
它甚至能像“知心客服”一样,在解释产品特性时,贴心地补充“和一个大苹果的重量差不多”这种直观感受,极大提升了用户体验。这种“超越简单检索”的服务意识,真是让人“暖心”。4
看来,百度这次是铁了心要在AI大模型这条赛道上“卷”出新高度。从多模态的ERNIE 4.5,到深度推论的ERNIE X1,再到文本能力登顶的文心5.0,百度的模型家族正在形成一个“全能战队”,不仅技术实力硬核,还把价格打到了地板上。
有消息称,百度计划在6月30日将ERNIE 4.5系列模型开源。2 这可就厉害了,如果真的开源,那AI生态的“活水”将彻底被盘活,更多的开发者和企业能以更低的成本拥抱AI,想想都让人激动!这波操作,难道是要把AI技术从“高阁”请下来,真正做到“普惠AI”吗?大模型的“战国时代”,看来才刚刚开始啊!
引用
-
Baidu ERNIE multimodal AI beats GPT and Gemini in benchmarks·AI News·(2025/11/13)·检索日期2025/11/13 ↩︎ ↩︎
-
百度發表Ernie X1以與DeepSeek R1競爭 - iThome·iThome·陳曉莉(2025/03/18)·检索日期2025/11/13 ↩︎ ↩︎ ↩︎ ↩︎
-
文心5.0 来了,百度大模型的破局之战原创 - CSDN博客·CSDN博客·(2025/11/13)·检索日期2025/11/13 ↩︎
-
全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了 - 网易·机器之心Pro·(2025/11/10)·检索日期2025/11/13 ↩︎ ↩︎ ↩︎