卷到天际！阿里开源4800亿参数编程模型，Kimi K2直呼“鸭梨山大”？

TL;DR：

阿里Qwen团队又双叒叕来“放大招”了！这次直接甩出4800亿参数的“编程超模”Qwen3-Coder，不仅能5分钟搭官网，还能让“代码小白”秒变“资深大佬”。这波操作，直接把一众对手卷到“喘不过气”，Kimi K2看了可能都要默默抱紧小被子。

就在科技圈“内卷”到白热化的当下，阿里Qwen团队又一次扔出了重磅炸弹！是的，你没听错，就在“刚刚”，他们的最新旗舰编程模型——Qwen3-Coder-480B-A35B-Instruct，正式“光荣开源”了。这可不是小打小闹，而是足足4800亿参数的“巨无霸”，堪称阿里迄今为止在编程智能体领域的“最强王炸”！¹

卷王驾到：参数、性能，一个都不能少！

4800亿参数，这个数字听起来是不是有点“唬人”？别急，它不仅仅是数字游戏。要知道，这玩意儿原生支持256K的上下文，这意味着它能一口气“读懂”25.6万个字符，比你写的一本小说的字数还多！而且，通过“黑科技”YaRN，它还能外推扩展到惊人的100万上下文，简直就是“记忆力超群”的学霸本人。更夸张的是，它的最大输出能达到6.5万token，这简直就是给程序员们开了一扇“任意门”！

当然，光参数大还不够，关键得“能打”！在“硬碰硬”的基准测试中，Qwen3-Coder直接把“开源SOTA”的头衔收入囊中，尤其在Agentic Coding（智能体编程）、Agentic Browser-Use（智能体浏览器使用）和Agentic Tool-Use（智能体工具调用）这三大神仙任务上，表现简直可以用“碾压式胜利”来形容。它的对手是谁？是大家熟悉的Kimi K2、DeepSeek V3，甚至连闭源的GPT-4.1都得靠边站！而它，竟然能和以编程能力著称的Claude Sonnet 4“平起平坐”，这波操作，简直是“把对手按在地上摩擦”的典范啊！²³

“阿里Qwen3系列模型迎来了重大更新，这次更新，让Qwen3的性能指标直接碾压Kimi K2和DeepSeek V3。” — 稀土掘金²

看这架势，是不是感觉“代码圈”要变天了？阿里官方甚至“凡尔赛”地表示，有了Qwen3-Coder，“刚入行的程序员一天就能完成资深程序员一周的工作”！更离谱的是，生成一个品牌官网，最快只需要5分钟！5分钟？！这速度，老板看了都得“笑出猪叫”，程序员看了直接“瑟瑟发抖”：饭碗，它是不是要不保了？

打工人狂喜：AI真的要替我们写代码了？

光说不练假把式，Qwen3-Coder不仅在榜单上“独占鳌头”，在实际体验中也让人“惊掉下巴”。在Qwen团队官宣前，这模型就已经悄悄在Qwen Chat官网上线，结果，一群“手速超快”的海外网友直接把它“玩疯了”！

有人让它搓了个Wordle单词游戏，结果，Qwen3-Coder交付的游戏页面和源代码，不仅功能齐全，“指令遵循、UI设计、动画方面的能力惊人，大部分测试结果一次就跑通了，完全不需要推理。” 这体验，简直就是“丝滑”到家了！¹

还有智东西的记者，亲自上手测试了一把：让Qwen3-Coder开发一个中英文术语库，支持增删改查。结果呢？“20多秒便完成了初步结果”，速度快到飞起！虽然在实际部署的扩展性上还有提升空间，但作为功能演示或原型展示，它已经“超纲”了。甚至连3D HTML这种“高难度动作”，它都能“圆满完成”，旋转动效、阴影效果都处理得“像模像样”。这简直就是“全能型选手”啊！

当然，Qwen3-Coder的“野心”不止于此，除了编程，它还提供了图像生成、视频生成等各种“花式玩法”，简直是个“多面手”，让人不禁感叹：这货，是要“抢饭碗”还是来“拯救世界”的？

硬核揭秘：这只“码农”AI是怎么炼成的？

那么，这只“编程超模”到底是怎么炼成的呢？Qwen团队在技术博客中“揭秘”了部分训练细节，简直是“硬核到没朋友”！

首先是预训练阶段，Qwen3-Coder“吞噬”了7.5万亿token的数据，其中代码数据占比高达70%！这就像一个“书呆子”，把全世界的代码都“背”了下来，难怪编程能力如此出众。

更绝的是，在后训练阶段，Qwen团队采取了“不走寻常路”的策略——大规模强化学习。他们认为，所有的代码任务都天生适合“执行驱动”的强化学习。为了“驯服”这只AI，他们构建了一个“超级工厂”，能够并行运行20000个独立环境！想象一下，2万个AI同时在2万个“虚拟世界”里“敲代码”、“测试bug”，然后把成功经验反馈给“大脑”，这不就是现实版的“码农军团”吗？！¹

这种**“长视距强化学习”**让Qwen3-Coder在解决现实世界软件工程任务（比如SWE-Bench Verified）时，能进行多轮交互、规划、使用工具、接收反馈并做出决策，最终实现了开源模型中的最佳性能。简直就是“AI版高考状元”，而且还是“不刷题就能考高分”的那种！

价格战还是生态战？：开源与商用的双重博弈

Qwen3-Coder不仅仅是“能打”，它还选择了一条“开源+商用”的道路。目前，它的480B版本已经在Hugging Face、魔搭等开源社区发布，可以直接下载和本地部署，这意味着开发者们可以“免费白嫖”这个强大的模型了！

但别忘了，它也在阿里云大模型服务平台百炼上线了API服务，而且采用了“阶梯计费”的方式。输入价格为6美元/百万token，输出价格为60美元/百万token（256K～1M一档）。相比之下，Claude Sonnet 4的输入输出价格分别是3美元和15美元。虽然Qwen3-Coder在某些档位与Claude Sonnet 4持平，但在最高上下文的计费上，还是“贵气逼人”。

不过，考虑到最近Cursor“断供”Claude等编程模型的消息，Qwen3-Coder的开源无疑是给国内开发者“雪中送炭”，提供了一个“新鲜出炉”的强力替代品。这不仅是模型能力的较量，更是一场关于“生态”和“未来”的博弈。当头部模型都开始走向开源，并且性能还如此炸裂时，AI的普及和应用速度，简直要坐上“火箭”了！

写在最后：AI“码农”，未来可期？

Qwen团队透露，他们还在不断努力，想让这个“Coding Agent”承担更多软件工程中“复杂又乏味”的任务，最终目标是“解放人类的生产力”。他们甚至在探索一个“大胆”的设想：Coding Agent是否可以实现自我提升？

这无疑给未来的程序员们抛出了一个终极拷问：当AI不仅能写代码，还能自己学习、自己进步，我们的“代码人生”将走向何方？是“躺平”享受AI带来的红利，还是被AI“卷”到无路可退？也许，未来的程序员，不再是“搬砖”的码农，而是“指挥”AI大军的“元帅”吧！敬请期待Qwen3-Coder更多尺寸的到来，以及它在未来给我们带来的更多“惊喜”和“惊吓”！

引用

刚刚，阿里最强编程模型开源，4800亿参数，Agent分数碾Kimi K2，训练细节公开·智东西·陈骏达（2025/7/23）·检索日期2025/7/23 ↩︎ ↩︎ ↩︎
Qwen 3深夜升级，碾压Kimi K2和DeepSeek V3 - 稀土掘金·稀土掘金（2024/7/23）·检索日期2025/7/23 ↩︎ ↩︎
国产模型新王诞生？新版Qwen3发布：性能超Kimi-K2、DeepSeek-V3·稀土掘金（2024/7/23）·检索日期2025/7/23 ↩︎