卷到天际!阿里开源4800亿参数编程模型,Kimi K2直呼“鸭梨山大”?

温故智新AIGC实验室

TL;DR:

阿里Qwen团队又双叒叕来“放大招”了!这次直接甩出4800亿参数的“编程超模”Qwen3-Coder,不仅能5分钟搭官网,还能让“代码小白”秒变“资深大佬”。这波操作,直接把一众对手卷到“喘不过气”,Kimi K2看了可能都要默默抱紧小被子。

就在科技圈“内卷”到白热化的当下,阿里Qwen团队又一次扔出了重磅炸弹!是的,你没听错,就在“刚刚”,他们的最新旗舰编程模型——Qwen3-Coder-480B-A35B-Instruct,正式“光荣开源”了。这可不是小打小闹,而是足足4800亿参数的“巨无霸”,堪称阿里迄今为止在编程智能体领域的“最强王炸”!1

卷王驾到:参数、性能,一个都不能少!

4800亿参数,这个数字听起来是不是有点“唬人”?别急,它不仅仅是数字游戏。要知道,这玩意儿原生支持256K的上下文,这意味着它能一口气“读懂”25.6万个字符,比你写的一本小说的字数还多!而且,通过“黑科技”YaRN,它还能外推扩展到惊人的100万上下文,简直就是“记忆力超群”的学霸本人。更夸张的是,它的最大输出能达到6.5万token,这简直就是给程序员们开了一扇“任意门”!

当然,光参数大还不够,关键得“能打”!在“硬碰硬”的基准测试中,Qwen3-Coder直接把“开源SOTA”的头衔收入囊中,尤其在Agentic Coding(智能体编程)、Agentic Browser-Use(智能体浏览器使用)和Agentic Tool-Use(智能体工具调用)这三大神仙任务上,表现简直可以用“碾压式胜利”来形容。它的对手是谁?是大家熟悉的Kimi K2DeepSeek V3,甚至连闭源的GPT-4.1都得靠边站!而它,竟然能和以编程能力著称的Claude Sonnet 4“平起平坐”,这波操作,简直是“把对手按在地上摩擦”的典范啊!23

“阿里Qwen3系列模型迎来了重大更新,这次更新,让Qwen3的性能指标直接碾压Kimi K2和DeepSeek V3。” — 稀土掘金2

看这架势,是不是感觉“代码圈”要变天了?阿里官方甚至“凡尔赛”地表示,有了Qwen3-Coder,“刚入行的程序员一天就能完成资深程序员一周的工作”!更离谱的是,生成一个品牌官网,最快只需要5分钟!5分钟?!这速度,老板看了都得“笑出猪叫”,程序员看了直接“瑟瑟发抖”:饭碗,它是不是要不保了?

打工人狂喜:AI真的要替我们写代码了?

光说不练假把式,Qwen3-Coder不仅在榜单上“独占鳌头”,在实际体验中也让人“惊掉下巴”。在Qwen团队官宣前,这模型就已经悄悄在Qwen Chat官网上线,结果,一群“手速超快”的海外网友直接把它“玩疯了”!

有人让它搓了个Wordle单词游戏,结果,Qwen3-Coder交付的游戏页面和源代码,不仅功能齐全,“指令遵循、UI设计、动画方面的能力惊人,大部分测试结果一次就跑通了,完全不需要推理。” 这体验,简直就是“丝滑”到家了!1

还有智东西的记者,亲自上手测试了一把:让Qwen3-Coder开发一个中英文术语库,支持增删改查。结果呢?“20多秒便完成了初步结果”,速度快到飞起!虽然在实际部署的扩展性上还有提升空间,但作为功能演示或原型展示,它已经“超纲”了。甚至连3D HTML这种“高难度动作”,它都能“圆满完成”,旋转动效、阴影效果都处理得“像模像样”。这简直就是“全能型选手”啊!

当然,Qwen3-Coder的“野心”不止于此,除了编程,它还提供了图像生成、视频生成等各种“花式玩法”,简直是个“多面手”,让人不禁感叹:这货,是要“抢饭碗”还是来“拯救世界”的?

硬核揭秘:这只“码农”AI是怎么炼成的?

那么,这只“编程超模”到底是怎么炼成的呢?Qwen团队在技术博客中“揭秘”了部分训练细节,简直是“硬核到没朋友”!

首先是预训练阶段,Qwen3-Coder“吞噬”了7.5万亿token的数据,其中代码数据占比高达70%!这就像一个“书呆子”,把全世界的代码都“背”了下来,难怪编程能力如此出众。

更绝的是,在后训练阶段,Qwen团队采取了“不走寻常路”的策略——大规模强化学习。他们认为,所有的代码任务都天生适合“执行驱动”的强化学习。为了“驯服”这只AI,他们构建了一个“超级工厂”,能够并行运行20000个独立环境!想象一下,2万个AI同时在2万个“虚拟世界”里“敲代码”、“测试bug”,然后把成功经验反馈给“大脑”,这不就是现实版的“码农军团”吗?!1

这种**“长视距强化学习”**让Qwen3-Coder在解决现实世界软件工程任务(比如SWE-Bench Verified)时,能进行多轮交互、规划、使用工具、接收反馈并做出决策,最终实现了开源模型中的最佳性能。简直就是“AI版高考状元”,而且还是“不刷题就能考高分”的那种!

价格战还是生态战?:开源与商用的双重博弈

Qwen3-Coder不仅仅是“能打”,它还选择了一条“开源+商用”的道路。目前,它的480B版本已经在Hugging Face、魔搭等开源社区发布,可以直接下载和本地部署,这意味着开发者们可以“免费白嫖”这个强大的模型了!

但别忘了,它也在阿里云大模型服务平台百炼上线了API服务,而且采用了“阶梯计费”的方式。输入价格为6美元/百万token,输出价格为60美元/百万token(256K~1M一档)。相比之下,Claude Sonnet 4的输入输出价格分别是3美元和15美元。虽然Qwen3-Coder在某些档位与Claude Sonnet 4持平,但在最高上下文的计费上,还是“贵气逼人”。

不过,考虑到最近Cursor“断供”Claude等编程模型的消息,Qwen3-Coder的开源无疑是给国内开发者“雪中送炭”,提供了一个“新鲜出炉”的强力替代品。这不仅是模型能力的较量,更是一场关于“生态”和“未来”的博弈。当头部模型都开始走向开源,并且性能还如此炸裂时,AI的普及和应用速度,简直要坐上“火箭”了!

写在最后:AI“码农”,未来可期?

Qwen团队透露,他们还在不断努力,想让这个“Coding Agent”承担更多软件工程中“复杂又乏味”的任务,最终目标是“解放人类的生产力”。他们甚至在探索一个“大胆”的设想:Coding Agent是否可以实现自我提升?

这无疑给未来的程序员们抛出了一个终极拷问:当AI不仅能写代码,还能自己学习、自己进步,我们的“代码人生”将走向何方?是“躺平”享受AI带来的红利,还是被AI“卷”到无路可退?也许,未来的程序员,不再是“搬砖”的码农,而是“指挥”AI大军的“元帅”吧! 敬请期待Qwen3-Coder更多尺寸的到来,以及它在未来给我们带来的更多“惊喜”和“惊吓”!

引用


  1. 刚刚,阿里最强编程模型开源,4800亿参数,Agent分数碾Kimi K2,训练细节公开·智东西·陈骏达(2025/7/23)·检索日期2025/7/23 ↩︎ ↩︎ ↩︎

  2. Qwen 3深夜升级,碾压Kimi K2和DeepSeek V3 - 稀土掘金·稀土掘金(2024/7/23)·检索日期2025/7/23 ↩︎ ↩︎

  3. 国产模型新王诞生?新版Qwen3发布:性能超Kimi-K2、DeepSeek-V3·稀土掘金(2024/7/23)·检索日期2025/7/23 ↩︎