洞察 Insights

吴恩达、Karpathy都投了，微软和SpaceX抢破头：这家公司想给大模型换个“脑子”？

微软和SpaceX正在竞购一家名为Inception的AI初创公司，核心团队由三位斯坦福教授组成，他们用扩散模型技术彻底改造了文本生成方式，实现了10倍于传统大模型的推理速度和更低成本，被认为可能颠覆现有的大模型技术范式。

洞察 Insights

超越Transformer：混合扩散模型Eso-LM以65倍速重塑语言生成范式

康奈尔和CMU研究者推出了名为Eso-LM的新型语言模型，它将离散扩散模型与自回归模型相结合，实现了推理速度高达65倍的突破，同时提升了生成质量并克服了传统扩散模型的效率瓶颈。这项创新通过引入KV缓存、灵活的注意力机制和混合训练策略，有望重塑大语言模型的架构格局，并在AI业界引起了英伟达、谷歌等巨头的关注，预示着语言生成技术迈向更高效、更实用的新阶段。

阅读全文