阿里AI“核弹级”四连发:这速度,是开挂还是真香?

温故智新AIGC实验室

TL;DR:

听说最近AI圈“卷”疯了,阿里直接开启“飙车模式”,一周之内连发四个大模型,不光性能“吊打”不少闭源大佬,还一股脑儿全开源了!这波操作,简直是把AI圈的天花板给“掀”了,让开发者们直呼“真香”!

最近AI圈子真是比夏天的天气还火热,隔三差五就冒出个“王炸”。但要说谁最能“整活儿”,最近的阿里AI绝对是C位出道。就在短短一周内,他们像开了“外挂”一样,一口气甩出四个开源模型:Qwen3系列的基础模型、编程模型Qwen3-Coder、推理模型,还有画风惊艳的通义万相Wan2.2。这波“日更级”的速度,不仅让围观群众惊掉了下巴,更是直接把“开源”俩字焊在了性能巅峰上。

以前总有人说,闭源模型才是高性能的“代言人”,开源顶多就是个“陪跑”。结果呢?阿里用实际行动告诉你,这套旧观念,该改改了!

性能炸裂:开源模型也能“遥遥领先”?

话说这四天里,阿里的三款Qwen3系列模型——Qwen3-235B-A22B-Instruct基础模型、Qwen3-Coder和Qwen3-235B-A22B推理模型,那是卯足了劲儿,直接在基础模型、编程和推理这些“兵家必争之地”登顶全球开源榜。

先说说Qwen3-235B这个**“非思考模式”基础模型的“天花板”**。它有多牛?简单讲,就是跑起来又快又省!只要4张H20显卡就能带得动2350亿参数的模型,显存占用只有同类模型的1/3,推理速度还提升了1.8倍。别小看这“非思考模式”,它就像一个专注高效的“工作狂”,在GPQA、AIME25、Arena-Hard等一系列专业考试中,竟然能把Claude4(Non-thinking)这类闭源大佬都“干翻”!1 想象一下,以后你和AI实时对话、让它帮你自动化处理事务,那速度,简直是“咻”的一下,体验感直接拉满。

再看Qwen3-235B-A22B推理模型,它能处理256K上下文的超长文本,解题能力那叫一个“脑力全开”。在知识、逻辑推理、数学、编程、创意写作甚至多语言能力上,都表现出“与顶级闭源模型Gemini-2.5 Pro、o4-mini可比肩”的实力。1 这不就是告诉我们,以后想找个靠谱的“AI学霸”帮你写论文、算数学,不用再盯着那些“天价”闭源模型了,开源的也一样香!

而通义万相Wan2.2则直接把我们带进了“多模态”的未来。文生视频、图生视频、统一视频生成,三款模型齐发。其中文生视频和图生视频更是业界首创使用了MoE(混合专家)架构的视频生成模型。简单来说,它就像一个由不同领域专家组成的“梦之队”,高噪声专家负责大局,低噪专家负责细节,不仅能节省50%的计算资源,还把视频里的复杂运动、人物交互、美学表达都拿捏得死死的。这波操作,估计影视、广告行业的设计师们要乐开花了,AIGC从此进入“电影级别”的工业化生产时代?

不过,要说最让开发者们“沸腾”的,那非Qwen3-Coder编程模型莫属了。它首次把MoE架构引入编程领域,激活参数达35B,上下文更是直接拉到1M!这什么概念?这意味着你的AI“码农”可以写出更长、更复杂的代码,还能像人类一样理解你的意图。在多语言SWE-bench、Mind2Web、Aider-Polyglot等Agent能力评估中,Qwen3-Coder超越GPT4.1、Claude4等顶尖闭源模型,直接“秀肌肉”。1 以后,程序员们可能真的能实现“一句话生成3D物理模拟代码”、“5分钟搭建品牌官网”这种神操作了。这简直是AI编程界的“平替”天花板,闭源模型的“饭碗”岌岌可危啊!

这款编程模型一发布,直接霸榜全球最大AI开源社区HuggingFace模型总榜冠军,硅谷大佬们都坐不住了。推特创始人杰克·多尔西、Perplexity CEO 阿拉温德·斯里尼瓦斯、a16z合伙人马克·马斯克罗,甚至HuggingFace CEO 克莱门特·德朗格都激动得连发12条推文,向全球开发者力荐。1 看来,这股“东方神秘力量”是真的把老外们给震住了!

生态放大招:这波是“技术普惠”还是“生态锁定”?

你以为阿里只是想秀肌肉?图样图森破!有硅谷工程师因为GitHub上“突然出现中国开源的AI编程模型”,一键卸载了月付200美元的Claude Code。1 这说明啥?不仅“性价比高”,还“听劝”! 开发者们直呼Qwen团队是“有求必应”、“开源懂帝”,“开发者需要什么,千问团队就开源什么。” 比如,Qwen3-235B非思考模型的推出,就是听了开发者的建议,才放弃了混合思考模式,分开训练,力求最优质量。1 这份“用户至上”的服务态度,简直是业界一股清流!

大规模参数模型的开源,就像给开发者和中小企业发了一张“免单券”,让大家不用再为高昂的授权费头疼,也能用上最顶尖的模型。这波操作,明面上是“技术共享”,实则更是一招高明的“生态锁定”战略:以开放换生态,以生态锁云端。 阿里通过魔搭社区和HuggingFace双平台,构建了一个跨语言、跨场景、跨行业的全球开发者生态。开发者在开源社区贡献代码,在魔搭社区体验、微调、部署,最终形成从模型开源、生态繁荣到技术反哺的良性循环。

这种“开源红利”已经开始显现。李飞飞团队基于Qwen开源模型训练出s1-32B,性能媲美顶尖推理模型;杭州创业团队开发的PolyGlot同传工具,端到端延迟远超传统70B模型。1 这不就是“众人拾柴火焰高”的真实写照吗? 中国AI的全球影响力,正在这种“开放协作”中加速卷积。

弯道超车?中国AI这次要“定义规则”了?

短短一周的“飓风行动”,阿里AI不仅重新点燃了中国科技公司的AI叙事浪潮,更在技术迭代的广度和深度上,直追全球最顶级的AI玩家。

阿里这套“组合拳”的厉害之处在于:

  • 敏捷研发速度:模型覆盖“全尺寸”、“全模态”、“多场景”,就像个“百变金刚”,快速迭代,满足各种开发需求。
  • 开源铁律:几乎所有模型都是研发成功就第一时间开源,践行“技术民主”,让全球开发者都能第一时间用上最先进的模型。

过去十六年,阿里一直在云计算和AI技术上“闷声发大财”,如今已是全球少数具备“全栈AI能力”的企业。从分布式计算、自研芯片、大模型到行业应用,这种“全栈AI”的垂直整合,就像给AI能力装上了“涡轮增压器”,能把技术快速落地到产业链核心环节,加速迭代,繁荣生态。

这种“开源平权”与“全栈整合”的结合,简直是给中国乃至全球AI产业开辟了一条不同于闭源路线的“新赛道”。通过“多快好省”的训练方式,以“性能+成本”的双重碾压,中国的开源模型正在从根本上动摇闭源模型的“定价权”。这无疑将引发AI从闭源主导到开源主导的新一轮变革,而中国企业在其中扮演的“主动出击”角色,或将重塑全球AI技术的竞争格局

不信你看,全球知名大模型API聚合平台OpenRouter最新榜单显示,中国DeepSeek和阿里通义千问已跻身全球前五。其中,通义千问更是以10.4%的市场份额,超越OpenAI的4.7%,位列第四。1 曾经我们还在追赶,现在呢?直接把OpenAI甩在了身后,这波“弯道超车”是不是有点太刺激了?

目前,阿里千问在全球主要模型社区的下载量已突破4亿,衍生模型更是突破14万个,直接超越Meta的Llama系列,成为全球第一的开源模型家族!1 国内也有30多万家企业和机构(比如中国一汽、联想、国家天文台等)接入了通义大模型,覆盖金融、制造、科研等领域。未来三年,阿里更是计划投入3800亿持续建设云和AI基础设施,并把开源定为长期战略。

阿里AI的加速布局背后,不仅仅是一场技术“军备竞赛”,更是一场关乎未来的“国运之战”。随着AI技术从“工具”进化为“基础设施”,这场战役的胜负,将直接决定中国在AI时代的全球话语权。这场“开源革命”,我们拭目以待!

引用


  1. 36氪. 一周四连发,阿里AI跑出飓风速度·36氪·2025/7/29·检索日期2025/7/29 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎