首页
洞察
早报
日报
主题探索
关于
算法创新
洞察 Insights
谷歌MoR:大模型计算范式的新篇章,超越Transformer的效率哲学
谷歌最新发布的MoR(Mixture-of-Recursions)架构,以统一参数共享、自适应递归深度和高效KV缓存为核心,实现了大语言模型推理速度翻倍、KV内存减半的突破。这不仅大幅提升了模型效率,降低了部署成本,更是谷歌在底层AI计算范式上的一项战略性创新,有望加速AI技术的普及和商业化进程,并引领未来AI模型的发展方向。
阅读全文