重塑算力版图:华为“超节点+全栈开源”如何锻造AI时代的公共事业与生态韧性

温故智新AIGC实验室

TL;DR:

华为正通过“超节点+集群”的系统级创新与“全栈开源”的生态战略,将AI算力从稀缺资源转变为可普惠的公共事业。此举不仅是对当前算力瓶颈与外部挑战的积极回应,更旨在构建一个开放、自给自足的中国AI底层基础设施,深刻影响全球AI竞争格局与产业未来。

约翰·麦卡锡关于“计算将组织成公共事业”的预言,在AI浪潮的推动下正加速成为现实。算力,作为驱动人工智能发展的核心引擎,已成为全球科技巨头竞相争夺的战略高地。在此背景下,华为在2025华为全联接大会上提出的“超节点+集群”算力解决方案与“全栈开源”战略,不仅是其自身技术积累的最新展现,更被视为重塑全球AI算力版图、构建未来数字基础设施的关键一步。这不仅是对技术原理的深层探索,更是对商业模式、产业生态乃至社会哲学的多维度思辨。

战略意图解读:算力“公共事业”的时代宣言

华为副董事长、轮值董事长徐直军在大会上强调:“算力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”1 这一论断深刻揭示了算力在迈向通用人工智能(AGI)和物理AI征程中的核心地位。尽管像DeepSeek这样高效的模型能够通过优化算法在一定程度上降低算力需求,但在涉及物理交互、全局最优解探索等复杂场景中,海量算力依然是不可或缺的基石。

华为此次战略布局,并非仅仅追逐单点技术性能的极致,其背后蕴含着对当前全球科技竞争格局的深刻洞察和对未来发展路径的独立思考。面对全球范围内日益加剧的芯片供应链不确定性,华为的“超节点+集群”方案,本质上是一种**“系统级效率突围”2。它将算力供给的焦点从单纯依赖先进制造工艺的单颗芯片性能,转向通过架构创新、大规模互联和软件协同来提升整体系统效能。这是一种战略性迂回,旨在规避外部限制**,为中国AI发展提供“可持续且充裕的算力”1

这一战略目标直指将算力打造为一种如同电力、通信一般的“公共事业”,意味着算力资源的普惠化、可扩展性和稳定性。这不仅是技术层面的突破,更是对国家级数字基础设施建设的长期承诺,预示着一个以系统协同而非单一部件领先为核心的竞争新范式。

技术原理与创新点:超节点集群的“系统级效率突围”

华为的“超节点+集群”方案,是其在AI算力领域七年深耕的集大成者。从早期的昇腾310到如今的昇腾910B/910C,再到未来规划的昇腾950、960、970系列,华为坚持“一年一代、算力翻倍”的迭代节奏2,不断提升AI芯片的算力、能效比、内存带宽及低精度数据格式支持能力。Ascend 950系列新增对FP8、MXFP8、MXFP4等低精度格式的支持,并通过自研HBM合封方式强化场景化定制能力,这些都是对AI计算实际需求的精准响应。

然而,真正的创新突破在于“超节点”架构。徐直军对“超节点”的物理和逻辑定义,揭示了其**将多台机器在逻辑上统一为一台“能学习、思考、推理的计算机”**的本质1。这并非简单的物理叠加,而是通过高度优化的互联协议和管理软件,实现对海量计算资源的无缝集成和高效调度。此次发布的Atlas 950/960超节点,分别支持8192张和15488张昇腾卡,在满配条件下,其总互联带宽预计将超过当前全球互联网峰值带宽的10倍以上3

在此基础上构建的Atlas 950 SuperCluster和Atlas 960 SuperCluster,分别突破50万卡和达到百万卡规模,被华为自豪地称为“目前全球最强算力集群”1。这不仅是算力规模上的跃升,更是对传统冯·诺依曼架构瓶颈的系统性破解。其核心在于华为自研的灵衢(UnifiedBus)互联协议,从1.0升级到2.0,通过正交架构、液冷接头浮动盲插设计、UB-Mesh递归直连拓扑网络等创新,实现了单板内、单板间和机架间的NPU全互联,为大规模AI计算任务提供了**“零收敛、高带宽、低时延”**的底层保障3

值得关注的是,华为还首次将超节点技术引入通用计算领域,推出基于鲲鹏950处理器的TaiShan 950通用计算超节点,以及将TaiShan 950和Atlas 950打造成混合超节点,为下一代生成式推荐系统等应用打开了全新的架构方向。这体现了华为在通用与AI计算融合方面的深远布局。

生态布局评估:全栈开源的共建之道

技术创新固然重要,但构建繁荣的产业生态才是其持续发展的动力。华为深谙“只要有足够的眼球,所有的Bug都是肤浅的”这一林纳斯定律2,坚定拥抱开源开放。其“四个坚定”——坚定开源开放、坚定发展人才、坚定全球合作、坚定战略投入——描绘了其雄心勃勃的生态蓝图。

华为的开源战略是全栈式的,涵盖了从底层硬件使能到上层应用开发的各个环节:

  • 硬件开放:开放昇腾模组和标卡,以及灵衢互联能力,支持生态伙伴打造定制化超节点产品4
  • 基础软件开源:CANN(芯片使能层)、MindSpore(AI框架)、Mind系列应用使能套件、openPangu(大模型)全面开源,与业界主流框架如PyTorch、vLLM等社区紧密合作,实现新特性和开发计划的首发同步。这正在构建一个与“PyTorch+CUDA”对标的自主技术体系2
  • 通用计算领域:openEuler(操作系统)、openGauss(数据库)、openFuyao(算力集群软件)等全面开源,并向openEuler贡献通智融合组件。

为了加速开发者社区的成长,华为投入了巨大的资源,包括:

  • 组织保障:成立CANN技术指导委员会,确保技术推进与落地系统性。
  • 资源投入:每年投入1500P算力、3万开发板,并计划未来五年每年投入150亿人民币生态发展费用和15000人进行生态平台开发与支持。
  • 人才培养:启动“基础软件千校行动”,计划覆盖全球20多个国家、2000多所高校,培养1万名教师和100万新型软件人才2

这种“硬件+软件,通用+AI,开发者+应用端”的全面开源开放策略,是华为在全球竞争中构建差异化优势、争取技术主导权的战略性抉择。它旨在降低开发者使用昇腾算力的门槛,加速技术创新与行业渗透,通过广泛的合作将AI技术落地到金融、能源、制造、教育、医疗等垂直行业,形成强大的网络效应和自生能力。

未来发展路径与社会经济影响:构建韧性与创新的中国AI底座

华为的“超节点+全栈开源”战略,不仅是技术和商业模式的创新,更是对AI未来发展路径和深层社会经济影响的积极塑造。

从技术演进看,华为正在引领AI算力从“单卡性能竞争”迈向“系统级效率突围”的新阶段。这种架构创新将使得未来AI模型在训练和推理上更具效率和可扩展性,尤其对于需要处理海量多模态数据、向物理世界拓展的AGI和具身智能而言,这种系统级的算力底座是不可或缺的。未来3-5年,我们可能会看到基于超节点架构的AI应用在处理复杂任务、降低训练成本方面取得突破性进展,甚至催生出全新的AI应用范式。

从商业版图看,华为此举有望使其在全球AI基础设施领域占据独特的战略位置。通过提供从芯片到超节点、集群,再到全栈开源软件的一体化解决方案,华为正在构建一个强大的护城河。这种“计算公共事业”的模式,将使其成为企业级AI和数字化转型的重要赋能者,尤其是在对数据安全和自主可控性有较高要求的市场。其长期主义的投资策略和对生态建设的坚定投入,也为潜在合作伙伴和开发者提供了稳定的预期。

从社会影响看,华为的算力战略对中国乃至全球的科技自主创新具有深远意义。它不仅解决了当前算力瓶颈,更通过构建开放、韧性的底层技术生态,为中国AI产业提供了“源源不断的算力支持和供给”1。大规模的人才培养计划,则为未来的数字经济输送了关键的知识资产。然而,我们也需审慎思考,这种高度集成的算力体系如何保持其开放性、避免潜在的中心化风险,以及其推广过程中的国际合作与竞争平衡。

徐直军曾言,AI可能“还处在2G时代”,充满不确定性。1 华为的战略正是试图在这一充满未知的前沿领域,开创一条“中国自己的AI算力创新之路”。通过超节点集群的硬件突破与全栈开源的软件赋能,华为不仅提供了一种解决算力问题的实际方案,更是在描绘一幅由系统创新和开放生态驱动的未来AI文明图景,其影响将远超技术本身,触及产业结构、地缘政治乃至人类文明进程的深层变革。

引用


  1. 华为徐直军:努力打造“超节点+集群”,让中国没有算力之忧·科技日报·崔爽(2025/9/24)·检索日期2025/9/28 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 华为公布AI算力新蓝图:一年一代,算力翻倍!·金羊网·潘亮(2025/9/20)·检索日期2025/9/28 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. 超节点架构创新,开源开放共筑全场景算力底座- 华为 - Huawei·华为(2025/9/18)·检索日期2025/9/28 ↩︎ ↩︎

  4. 中国AI高速路,华为给出开源开放方案 - 量子位·量子位·henry(2025/09/24)·检索日期2025/9/28 ↩︎