美团LongCat-2.0：在国产算力的“无人区”里，造一座并不透明的城

TL;DR：

美团LongCat-2.0以1.6万亿参数全流程国产化训练，验证了在算力封锁下构建顶尖AI集群的可行性。但“闭源数据与权重”的战略选择，使其在展示工程奇迹的同时，也陷入了从“基础设施”转向“私有护城河”的争议之中。

技术突破：在国产芯片的“深水区”试航

LongCat-2.0的发布，本质上是AI工程化领域的一次“极限压力测试”。在美团之前，国内对于万亿参数模型的探索多止步于“基于已有权重的后训练”或“小规模验证”。美团选择了一条极为艰险的路径：基于五万卡国产算力集群，从零开始完成预训练。¹

从技术实现看，LongCat-2.0的MoE（混合专家）架构引入了“零计算专家”（Zero-computation Experts）设计，将稀疏度推向了97%的理论渐近线。² 这意味着该模型已进入“效率博弈”的深水区——即如何通过动态路由机制，在固定算力预算下精准分配资源。这种架构层面的精细化，实际上是将硬件架构的局限通过软件算法的“弹性”巧妙补足。

商业逻辑：算力作为一种资产，而非纯粹的公地

美团将LongCat-2.0定位为垂直于本地生活与Agentic Coding的工具，而非通用多模态模型。这一选择具有极强的商业实用性：外卖配送、商家服务与复杂的Agent任务，构成了美团独有的、极具价值的闭环数据池。³

然而，LongCat-2.0的“待开源”状态（权重暂未开放、训练数据黑箱），折射出企业在AI时代的底层焦虑。对于美团而言，这五万卡集群的折旧与电力成本是巨大的现金流负担，但通过将大模型内化为支撑业务的AI操作系统，这种成本能够通过履约效率的提升和运营成本的边际递减被消化。这是一种典型的“重资产、高壁垒”策略，与追求极致开源精神的DeepSeek模式形成了鲜明对比。⁴

哲学思辨：开源的界限与“期房”困境

当科技行业将“开源”视为信仰时，LongCat-2.0提供了一个反直觉的样板：它利用了开源的名义（MIT协议）获取社区关注与评测声望，但在核心配方上实行闭源。这引发了关于“技术公共基础设施”定义的深刻争论。

工程演示 vs. 公共设施：LongCat-2.0证明了“国芯+国模”链路可以打通，这对中国AI产业具备重要的战略象征意义，但其缺失的可复现性，使其更像是一座“样板间”，而非开放给全行业的“高速公路”。
黑箱时代的信任缺失：在权重不开放、数据不公开的情况下，59.5分的SWE-bench成绩更像是企业信用背书的结果，而非科学界可独立验证的真理。

未来展望：国产算力的“溢价”与分化

未来3-5年，AI产业将呈现出明显的路线分化。一方面是像DeepSeek这类追求“极简算法与完全开源”的公共效用模型，另一方面则是像美团LongCat这样，深度绑定特定业务场景与全栈算力基础设施的“私有堡垒”。⁵

国产算力生态正处于从“能用”向“好用”的过渡期。LongCat-2.0的意义不在于它是否超越了GPT-5.5，而在于它通过真金白银的token消耗和海量调用量，证明了国产算力集群可以承载真实世界的高并发需求。随着算子库的成熟和集群故障恢复机制的完善，我们预判，国产芯片将不再仅作为“替代品”，而是成为特定领域AI训练的首选路径。

引用

业界首个：美团LongCat-2.0发布，国产芯片上跑出的万亿参数模型 · IT之家 · 2026/6/30 · 检索日期2026/7/3 ↩︎
美团发布「零英伟达」万亿大模型，「国芯+国模」彻底跑通了？ · 36氪 · 2026/6/30 · 检索日期2026/7/3 ↩︎
美团开源万亿参数大模型LongCat-2.0，五万卡国产算力全流程训练 · 搜狐网 · 2026/6/30 · 检索日期2026/7/3 ↩︎
美团LongCat-2.0评测：SWE-bench Pro 59.5 超越 GPT-5.5 · DeepSeek技术社区 · 2026/7/1 · 检索日期2026/7/3 ↩︎
实测美团LongCat-2.0，国产芯片长出来的万亿大模型 · X (Twitter) · 2026/6/30 · 检索日期2026/7/3 ↩︎