TL;DR:
阿里云在2025云栖大会上发布的面向Agent的全栈能力体系,不仅通过Qwen3系列大模型大幅提升了AI的认知与执行边界,更在底层基础设施、开发平台与服务生态上进行了革命性升级,预示着一个以智能体为核心的“AI超级计算机”时代的到来,将深刻改变企业数字化和人机交互范式。
2025云栖大会现场,阿里云智能首席技术官周靖人宣布的一系列重磅技术更新,不仅是其大模型家族“通义千问”的七连发,更是其围绕“Agent(智能体)”构建全栈能力体系的战略性宣言。这一系统化的技术布局,远超单一模型性能的迭代,它标志着阿里云正在走向以Agent为中心的智能服务新范式,试图在技术、商业和社会层面,共同定义未来AI的形态与能力边界。
技术突破与Agent能力重塑
阿里云此次发布的核心,是大模型在深度智能和自主执行能力上的显著跃升,为构建高级Agent奠定了基石。旗舰模型Qwen3-Max的表现尤为亮眼,其性能超越了GPT5和Claude Opus 4,跻身全球前三,预训练数据量达36万亿(36T)Tokens,总参数超过万亿。1 这不仅是算力的堆砌,更是算法精进的体现,尤其在Agent工具调用能力(Tau2-Bench测试斩获74.8分,超越Claude Opus4和DeepSeek-V3.1)和编程能力(SWE-Bench Verified测试达69.6分,位列第一梯队)上取得突破性进展。Agent的“思考”和“行动”能力由此得到了前所未有的加强。
Qwen3-Next架构的发布,以其80B参数仅激活3B即可媲美235B模型,实现了计算效率的重大突破。通过混合注意力机制、高稀疏度MoE结构及多Token预测机制等创新,训练成本大幅降低超90%,长文本推理吞吐量提升10倍以上。1 这为Agent在处理复杂、长程任务时的经济性和效率设立了新标准,打破了模型规模与运行成本之间的固有矛盾,使得部署更为智能、复杂的Agent成为可能。
多模态领域的进展同样关键。Qwen3-VL视觉理解模型的开源,使其不仅能看懂图片,还能像人一样操作手机和电脑,自动完成日常任务,甚至能将设计图转化为Draw.io/HTML/CSS/JS代码,实现“所见即所得”的视觉编程。其升级的3D Grounding能力,为具身智能(Embodied AI)夯实基础。而Qwen3-Omni全模态模型的惊喜亮相,以其在音视频能力上的32项SOTA,首次实现听、说、写多模态混合训练中各功能稳定不降智的突破,使得Agent能够像人类婴儿般全方位感知和交互世界。这些进展意味着Agent将不再局限于文本,而是能够跨越模态界限,以更自然、更具情境感的方式与物理世界和数字世界进行交互。
全栈Agent开发与服务生态
阿里云将这些强大的模型能力系统性地集成到其Agent开发与服务生态中,以满足日益增长的企业级需求。核心是**阿里云百炼(Alicloud Bailian)**平台,其模型日均调用量一年内增长15倍,印证了市场对Agent技术的热切渴望。
新发布的ModelStudio-ADK(Agent开发框架)基于通义开源的AgentScope打造,突破了传统预定义编排的局限,赋能企业高效开发具备自主决策、多轮反思和循环执行能力的Agent。1 这种“高代码”模式允许深度定制和复杂逻辑实现,例如1小时内即可开发一个深度报告生成Agent。同时,**ModelStudio-ADP(低代码Agent开发平台)**的升级,已在金融、教育、电商等领域广泛应用,如网商银行基于其开发的贷款审核应用,将任务处理时间从3小时缩短至5分钟,准确率超95%,展现了Agent在提升业务效率上的巨大潜能。1
商业敏锐度体现在其组件服务上。百炼集成了工具连接、多模数据融合RAG、沙箱工具、智能记忆存取等7大企业级能力,尤其值得关注的是与支付宝联合首发的Pay Server,为企业级Agent提供了专业的商业化支付通道,这不仅是技术集成,更是将Agent能力与商业闭环深度耦合的关键一步。
更具未来主义色彩的是无影AgentBay的重大升级,作为阿里云为Agent量身打造的“超级大脑”,它可动态调用云上算力、存储及工具链资源,突破本地设备算力限制。其新增的自进化引擎、自定义镜像、安全围栏、内存状态管理等能力,以及首次展示的无影Agentic Computer这一全新个人计算产品,描绘了一幅Agent拥有革命性“记忆”能力和近乎无穷云上算力,改变人机交互方式的未来图景。
AI基础设施的深层变革
支撑上述Agent智能体和模型能力爆发的,是阿里云在AI基础设施层面的全面升级。过去一年,阿里云AI算力增长超5倍,AI存力增长4倍多。1 这种投入并非简单的扩容,而是面向AI负载的软硬协同全栈优化与系统创新。
新一代磐久128超节点AI服务器由阿里云自主研发,集成了自研CIPU 2.0芯片和EIC/MOC高性能网卡,单柜支持128个AI计算芯片,推理性能相对传统架构提升50%。1 这体现了对垂直整合和定制化硬件的深刻理解,以应对AI计算的独特需求。
网络层面,HPN 8.0高性能网络采用训推一体化架构,GPU互联带宽达到6.4Tbps,支持单集群10万卡GPU高效互联,为万卡大集群提供高性能、确定性的云上基础网络。存储方面,表格存储(Tablestore)为Agent提供高性能记忆库和知识库,对象存储OSS推出Vector Bucket,提供高性价比向量数据存储,成本较自建开源向量数据库骤降95%。1 这些都精准对接了Agent对高速内存、庞大知识库和高效向量检索的核心需求。
智能计算灵骏集群的稳定性和效率优化,以及容器服务ACK/ACS针对AI Agent场景的深度优化,如Serverless GPU算力开箱即用、每分钟15000沙箱的大规模并发弹性,都旨在为Agent提供随需启用、高效响应的极致运行环境。阿里云人工智能平台PAI与通义大模型联合优化,实现了训练端到端加速比提升3倍以上,推理吞吐TPS增加71%,时延降低70.6%的“1+1>2”效果。1
这些基础设施的升级,共同构建了阿里云CTO吴泳铭所描绘的“一台全新的AI超级计算机”的愿景,一个拥有最领先AI基础设施和最领先模型,两者高度协同的全新计算平台。1
产业格局重塑与社会影响评估
阿里云的Agent全栈战略,无疑将深刻影响全球AI产业的竞争格局。凭借其在中国AI云市场35.8%的份额和在已采用生成式AI的财富中国500强企业中超53%的渗透率,阿里云正在通过自研全栈AI能力,构建一个强大的护城河和飞轮效应。1 阿里巴巴未来三年投入3800亿用于云和AI基础设施的承诺,远超过去十年总和,彰显其将AI视为核心增长引擎的决心。
从哲学思辨的角度看,Agent的普及,特别是具身智能与多模态Agent的出现,将模糊人类与机器工作的界限。无影Agentic Computer所描绘的“革命性记忆能力和近乎无穷的云上算力”,可能意味着我们与数字世界的交互方式将从“指令式”转向“委托式”,即人类将任务委托给拥有自主思考和执行能力的智能体。这可能带来工作模式的根本性变革,部分重复性、甚至认知密集型任务将由Agent自动完成,人类的价值将更多地体现在创造性、决策性和情感互动上。
然而,这种深刻的变革也伴随着潜在的风险与挑战。Agent的自主决策能力、多轮反思机制,虽然提升了效率,但也可能引入新的伦理和治理问题,例如责任归属、决策的透明度、以及对人类隐私和数据安全的潜在影响。如何确保Agent在复杂场景下的行为可控、符合人类价值观,将是技术发展必须持续关注的焦点。此外,Agent带来的工作岗位结构性调整,也要求社会在教育、技能培训等方面进行前瞻性规划。
阿里云的全栈Agent战略,不仅是技术层面的创新,更是对未来智能基础设施、商业模式、乃至人类社会组织形态的全面押注。它为企业提供了通往智能化转型的清晰路径,也向我们展示了智能体作为“下一代计算机操作系统”或“数字劳动力”的核心潜力。