美团LongCat-2.0:在国产算力的“无人区”里,造一座并不透明的城

温故智新AIGC实验室

TL;DR:

美团LongCat-2.0以1.6万亿参数全流程国产化训练,验证了在算力封锁下构建顶尖AI集群的可行性。但“闭源数据与权重”的战略选择,使其在展示工程奇迹的同时,也陷入了从“基础设施”转向“私有护城河”的争议之中。

技术突破:在国产芯片的“深水区”试航

LongCat-2.0的发布,本质上是AI工程化领域的一次“极限压力测试”。在美团之前,国内对于万亿参数模型的探索多止步于“基于已有权重的后训练”或“小规模验证”。美团选择了一条极为艰险的路径:基于五万卡国产算力集群,从零开始完成预训练。1

从技术实现看,LongCat-2.0的MoE(混合专家)架构引入了“零计算专家”(Zero-computation Experts)设计,将稀疏度推向了97%的理论渐近线。2 这意味着该模型已进入“效率博弈”的深水区——即如何通过动态路由机制,在固定算力预算下精准分配资源。这种架构层面的精细化,实际上是将硬件架构的局限通过软件算法的“弹性”巧妙补足。

商业逻辑:算力作为一种资产,而非纯粹的公地

美团将LongCat-2.0定位为垂直于本地生活与Agentic Coding的工具,而非通用多模态模型。这一选择具有极强的商业实用性:外卖配送、商家服务与复杂的Agent任务,构成了美团独有的、极具价值的闭环数据池。3

然而,LongCat-2.0的“待开源”状态(权重暂未开放、训练数据黑箱),折射出企业在AI时代的底层焦虑。对于美团而言,这五万卡集群的折旧与电力成本是巨大的现金流负担,但通过将大模型内化为支撑业务的AI操作系统,这种成本能够通过履约效率的提升和运营成本的边际递减被消化。这是一种典型的“重资产、高壁垒”策略,与追求极致开源精神的DeepSeek模式形成了鲜明对比。4

哲学思辨:开源的界限与“期房”困境

当科技行业将“开源”视为信仰时,LongCat-2.0提供了一个反直觉的样板:它利用了开源的名义(MIT协议)获取社区关注与评测声望,但在核心配方上实行闭源。这引发了关于“技术公共基础设施”定义的深刻争论。

  • 工程演示 vs. 公共设施:LongCat-2.0证明了“国芯+国模”链路可以打通,这对中国AI产业具备重要的战略象征意义,但其缺失的可复现性,使其更像是一座“样板间”,而非开放给全行业的“高速公路”。
  • 黑箱时代的信任缺失:在权重不开放、数据不公开的情况下,59.5分的SWE-bench成绩更像是企业信用背书的结果,而非科学界可独立验证的真理。

未来展望:国产算力的“溢价”与分化

未来3-5年,AI产业将呈现出明显的路线分化。一方面是像DeepSeek这类追求“极简算法与完全开源”的公共效用模型,另一方面则是像美团LongCat这样,深度绑定特定业务场景与全栈算力基础设施的“私有堡垒”。5

国产算力生态正处于从“能用”向“好用”的过渡期。LongCat-2.0的意义不在于它是否超越了GPT-5.5,而在于它通过真金白银的token消耗和海量调用量,证明了国产算力集群可以承载真实世界的高并发需求。随着算子库的成熟和集群故障恢复机制的完善,我们预判,国产芯片将不再仅作为“替代品”,而是成为特定领域AI训练的首选路径。

引用


  1. 业界首个:美团LongCat-2.0发布,国产芯片上跑出的万亿参数模型 · IT之家 · 2026/6/30 · 检索日期2026/7/3 ↩︎

  2. 美团发布「零英伟达」万亿大模型,「国芯+国模」彻底跑通了? · 36氪 · 2026/6/30 · 检索日期2026/7/3 ↩︎

  3. 美团开源万亿参数大模型LongCat-2.0,五万卡国产算力全流程训练 · 搜狐网 · 2026/6/30 · 检索日期2026/7/3 ↩︎

  4. 美团LongCat-2.0评测:SWE-bench Pro 59.5 超越 GPT-5.5 · DeepSeek技术社区 · 2026/7/1 · 检索日期2026/7/3 ↩︎

  5. 实测美团LongCat-2.0,国产芯片长出来的万亿大模型 · X (Twitter) · 2026/6/30 · 检索日期2026/7/3 ↩︎