从带宽竞赛到存力突围：LPDDR为何成为AI推理时代的“新基石”？

TL;DR：

AI推理阶段对“存力”的需求已从极致带宽转向容量与成本的最优平衡，LPDDR凭借成熟的消费电子生态与大容量优势，正从边缘侧渗透至数据中心，重塑AI基础设施的建设逻辑。

算力增长的“隐形刹车”：内存墙的重心偏移

长期以来，AI算力竞赛被戏称为“HBM的修罗场”。在模型训练阶段，为了填补GPU恐怖的计算吞吐，HBM凭借其多层堆叠的架构实现了无可匹敌的带宽优势，成为了英伟达等头部玩家的标配。然而，当技术叙事从“参数预训练”转向“大规模推理”，游戏规则悄然改变。

AI推理的本质在于“高效检索与读取”，而非单纯的计算峰值。当模型权重常驻内存，推理延迟与系统的内存容量及TCO（总体拥有成本）直接挂钩。HBM由于封装工艺复杂、良率受限且价格昂贵，在面临海量长上下文（Long Context）与Agent推理需求时，表现出了明显的“性价比瓶颈”。LPDDR（低功耗双倍数据率同步动态随机存取存储器）的“逆袭”，本质上是AI基础设施从“暴力性能导向”向“效能与规模部署导向”的范式转移。

技术逻辑的降维打击：为什么是LPDDR？

LPDDR从智能手机走向数据中心，并非简单的技术下放，而是一场工程学上的深刻权衡：

容量即正义：在处理百亿级参数大模型及冗长的KV Cache时，HBM受到物理封装与接口宽度的严格约束，单系统容量上限受限。高通AI200等方案利用LPDDR的布线灵活性，将单卡内存容量推向768GB量级，让模型推理不再频繁与SSD进行高延迟交换¹²。
供应链的成熟度：HBM依赖SK海力士、三星等少数厂商的TSV堆叠工艺，产能极其脆弱；而LPDDR依托庞大的手机与轻薄本产业链，拥有极高的供应韧性与边际成本优势。
工程部署的普适性：LPDDR的低功耗特性（以Intel Crescent Island为例，TDP仅350W）使得数据中心无需进行昂贵的液冷改造，这直接降低了基础设施建设的初始资本支出（CAPEX）¹。

产业格局的重塑：从“移动大脑”到“推理引擎”

随着JEDEC明确LPDDR6的技术路线，未来单颗内存芯片容量有望触达512GB，并引入x6子通道模式以提升集成密度¹。这一变化预示着“内存条”概念的消解——SOCAMM2等模块化封装形态的出现，正将内存与CPU/GPU的物理边界进一步模糊。

从商业视角看，这为国产芯片厂商提供了难得的窗口期。由于LPDDR生态获取门槛远低于HBM，国内厂商如曦望科技、江波龙等，正试图通过低功耗、高扩展性的内存方案，绕过被巨头垄断的HBM壁垒，实现推理芯片的差异化落地¹。资本逻辑已非常清晰：谁能掌握推理时代的“内存池化”技术，谁就能成为AI下半场应用落地降本增效的核心推手。

结语：算力之后的“存力”博弈

我们正在见证一场存算关系的重构。AI发展的上半场是GPU与HBM联手定义的“算力霸权”，而下半场将是LPDDR与存内计算（PIM）主导的“存力民主化”。当数以亿计的参数在轻薄设备甚至边缘端流畅运行时，AI将不再是昂贵的云端奢侈品，而是渗透进人类文明血管的底层能源。

引用

LPDDR逆袭：AI推理芯片为何集体“换芯”？·半导体产业纵横·作者：鹏程（2026/06/10）·检索日期2026/06/10 ↩︎ ↩︎ ↩︎ ↩︎
AI内存瓶颈（下）：DRAM与HBM·虎嗅网·作者：Henryhr（2026/06/10）·检索日期2026/06/10 ↩︎