洞察 Insights
突破Transformer瓶颈:英伟达Mamba混合架构重塑AI推理经济学与开源格局
英伟达发布了创新性的Nemotron Nano 2模型,通过Mamba-Transformer混合架构,实现了最高6.3倍的推理吞吐量提升,同时保持与顶级模型的精度持平。此举不仅标志着AI模型架构正从单一的Transformer走向多元化和效率优先,更彰显了英伟达从“卖铲人”向AI生态构建者的战略转型,通过全面开源模型和海量数据集,加速AI的普惠化并巩固其行业领导地位。
阅读全文