夏立雪:终结云计算“流水线”,以“思考”重塑智能体基础设施的未来

温故智新AIGC实验室

TL;DR:

无问芯穹联合创始人兼CEO夏立雪正引领一场深刻的基础设施范式变革,旨在将传统云计算的“流水线”模式,升级为能自主“思考”、协同进化的Agentic Infra,以此加速AGI时代的全面到来。他的愿景是让智能体像使用水电一样便捷高效地运用算力,通过创新性的异构算力调度和“基础设施智能体蜂群”,释放无尽算力潜能,推动AI从“重工程”迈向“轻创造”。

当数字世界的智能体(AI Agent)不再满足于被动执行指令,开始渴望“思考”、自主协作时,支撑其运行的基础设施也必须脱胎换骨。这场深刻的范式变革,正如无问芯穹联合创始人兼CEO夏立雪所预言和践行的那样,正在终结传统云计算的“流水线”时代,驶向一个由“Agentic Infra”主导的全新未来。他所描绘的,不仅是一幅技术演进图景,更是一个关于智能体如何重塑我们与计算世界关系,并最终触达通用人工智能(AGI)边界的宏大叙事。

时代的呼唤:从“流水线”到“思考者”

传统的云计算架构,如同一个高效运转的工业“流水线”,基于“请求-响应”的确定性范式,处理着离散且孤立的任务。然而,当智能体以其“感知-推理-行动-记忆”的非线性循环,开启有状态的认知过程时,这套传统体系的局限性便显露无遗。夏立雪一针见血地指出,这种从“处理”到“思考”的转变,对基础设施层的冲击是颠覆性的:“Agent 的任务不再是离散的。它不像外包工厂那样,被动接受指令、机械执行,而是具有关联性和‘状态’的连续任务体系。因此,我们的 Infra 也不能再像过去那样仅仅作为一个流水线存在,它必须具备一定的智能性,能够保障 Agent 执行任务的质量。1

这意味着,基础设施必须从“生产线工厂”转变为“解决方案公司”,为智能体的整体产出质量提供系统性支撑。夏立雪解释道,这需要在运行环境、工具、上下文和安全等多个维度进行升级,尤其是要能协调Agent连续又突发的多任务协作。他强调,核心在于环境的沙盒化与灵活调度能力,这直接决定了系统能否支持Agent在复杂任务链中的高效运行。

传统模式下,人们更注重“算得更快”;而在智能体时代,则变成了“想得更久”。“Agent 不仅需要更长的‘思考’时间,而且‘思考’与‘计算’所需的资源类型并不相同。”1 夏立雪敏锐地洞察到,这不仅对资源的灵活性、分配策略和实时调度提出了全新要求,更促使我们重新思考基础设施的设计逻辑。

塑造未来:夏立雪的A2A愿景与“蜂群”实践

尽管Agentic Infra听起来像一个激进的愿景,夏立雪却认为现在正是最佳时机。他指出,基础模型的能力已足够强大,但配套给Agent的基础设施服务与工具却相对滞后。这就像一位才华横溢的程序员,却苦于键盘和编译器的速度跟不上思维。真正的瓶颈,不在模型本身,而在支撑体系的响应能力。

无问芯穹提出了一种递进式的进化路径:从第一步的Agent Infra,让智能体走出实验室走向生产力;到第二阶段的Agentic Infra,推动智能体深度参与基础设施的核心工作流。后者不仅要持续加强环境、上下文、工具链、安全与可观测性,更要让系统能够自动发现异常、定位瓶颈、甚至进行资源优化和弹性伸缩,从而将运维人员从繁复的人工干预中解放出来。

这其中最具革命性的,莫过于A2A(Agent to Agent)——即Agent应该为自己设计工作流的理念。夏立雪用一个形象的比喻阐释了这一构想:“这就像拥有一位天才程序员,但我们不可能立刻让他担任CTO……现在的Agent Infra本质上仍是这种模式:人为地为程序设定流程和约束……我们更希望看到AI能够跳出这条生产线,自主设计流程,从而实现更高的效率。”1 在他看来,人类为Agent设计的工作流并不一定最优,而当后台运维Agent与前台客户服务Agent之间能够实现高效配合时,其效率远胜于人工的工程师中转方式。这标志着基础设施本身将具备一定自主行为,如同一个不断跨界协作的智能组织。

无问芯穹将这一愿景具象化为“基础设施智能体蜂群”体系。这个蜂群通过封装模型筛选、平台管家、资源运营、答疑排障、智算运维等模块,形成了一个高度自治、动态协作的体系,打造了覆盖基础设施全生命周期的智能感知、智能决策与智能执行闭环 2。它让“一句话,一个Agent”成为可能,极大地降低了调用复杂AI能力的门槛,将AI应用开发从“重工程”转变为“轻创造”。在实际客户案例中,例如拥有百万月活的二次元创作社区“捏TA”,引入蜂群体系后研发迭代速度提升了五倍;而Soul App则通过与蜂群体系的打磨,显著压缩了创新周期,降低了试错成本 2

释放无穹:异构算力的交响与高效利用

在国内多元且碎片化的国产算力生态背景下,无问芯穹选择“统一调度异构算力”作为其破局点之一。夏立雪将技术创新与效率提升视为一体,即实现资源的统一标准化,不仅要打通功能,更要实现任务的合理分配。他强调:“就像‘水管打通’之后,还要解决‘水库之间的协调’问题一样,这两者是相辅相成、不可分割的。1

这种对算力高效利用的追求,在Agentic Infra领域显得尤为关键。传统的AI算力基础设施以固定虚拟化或容器化单元划分资源,导致在Agent场景下极不经济——一个智能体可能并行尝试上百个小任务,但每个任务所需资源仅为传统“格子”的十分之一。这种粗放的模式,造成了大量的资源空转和浪费。

无问芯穹的解决方案是采用“微虚拟化沙箱、沙箱调度和高并发沙箱管理机制”,让算力按需动态拼装、快速回收,实现毫秒级环境切换和接近100%的资源利用。即便Agent的智能推理增加了算力需求,在这种优化架构下,增长依然可控,能够以合理成本支撑更复杂的智能行为 1。夏立雪曾用一个生动的比喻来阐释这种无感使用的理想状态:“我们打开水龙头时,不需要知道水从哪条河流而来。同样,未来我们使用AI应用时,也不必知道背后调用了哪些基座模型或哪一种算力资源。2

无问芯穹将这种能力具象化为“三个盒子”:面向超大规模集群的“无穹AI云”,实现异构算力网的“智能感知、实时发现、随需获取”;保障大规模模型训练与推理任务的“无界智算平台”,甚至能稳定支撑3000卡国产GPU集群长达600小时不间断训练;以及突破终端设备物理限制的“无垠终端智能”,通过“端模型+端引擎+端硬件”一体化解决方案,让AI PC即使在离线状态下也能高效运行大模型 3。这些产品正是其在技术上“求同”后,面向产业“整合”的重要体现。

心之所向:一位科学家的AGI情怀

回溯夏立雪的个人轨迹,他与人工智能的缘分始于2013年读博期间。彼时,人工智能热潮刚刚兴起,他便专注于AI与芯片打通方向的研究。亲眼见证AGI时代的真正到来,是他当时一个看似遥远的“有生之年”理想。

然而,AI在过去两年呈现的爆发式发展,远超他的想象。这股强大的推动力,让夏立雪感到自己的努力不仅不再微不足道,反而在加速整个行业的演进。他眼中闪烁着光芒,透露出一种被时代洪流选中、并乐在其中的兴奋:“对我而言,无论是人生目标还是事业目标,都与无问芯穹的使命高度重合。这也是我创建这家公司的初衷,我希望自己能在推动这个时代进步的过程中,贡献哪怕微小的一份力量。1

无问芯穹的使命,正是要“释放无穹算力,让AGI触手可及”。作为一名专注于人工智能系统而非算法的科学家,夏立雪更希望通过系统层面的创新,让AGI能够更高效、更可持续地实现。在他看来,技术先进性与工程落地保障客户服务是相辅相成、互相迭代的关系。解决客户痛点的过程,本身就是技术演进的重要方向,两者形成一个“良性的技术与应用双向飞轮” 1

展望未来三到五年,夏立雪希望能看到智能体之间进一步形成组织,共同完成更复杂的任务,届时,“各个智能体的KV Cache和上下文可以根据需求实现共享或隔离。若能做到这一点,人类将能够释放出大量脑力与生产力,专注于更有创造性和价值的工作。”1 这不仅是他个人的核心目标,也是作为一名科学研究者最想亲眼见证的理想。夏立雪和无问芯穹,正以先行者的姿态,为智能体时代的到来,夯实最为坚固的基石。

引用


  1. Agent 正在终结云计算“流水线”,Infra 必须学会“思考” | 专访无问芯穹夏立雪·网易新闻·(2023/10/26)·检索日期2023/11/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 基础设施进入Agent 时代:无问芯穹的“蜂群式”尝试| 雷峰网·雷峰网·郑佳美(2023/10/26)·检索日期2023/11/20 ↩︎ ↩︎ ↩︎

  3. 这届世界人工智能大会,无问芯穹发布了“三个盒子” - 证券时报·证券时报网·张淑贤(2025/07/28)·检索日期2023/11/20 ↩︎