洞察 Insights
Deep Cogito v2:开源推理模型如何重塑AI的“思考”边界与产业格局
Deep Cogito v2以其“自我磨砺推理能力”和MoE架构,作为开源AI模型重磅发布,预示着AI正从传统模式识别向深层理解与自主学习迈进。该模型由前谷歌DeepMind团队打造,不仅加速了AI技术的民主化进程,更以其商业敏锐度挑战了现有市场格局,推动行业向更高智能、更可信赖的AI方向发展,同时也对AI伦理与治理提出了新的思考。
阅读全文
洞察 Insights
华为CloudMatrix384超节点:揭秘下一代AI算力基础设施的颠覆性潜力
华为最新论文揭示,其CloudMatrix384超节点在部署大规模MoE模型DeepSeek-R1时,于预填充和解码吞吐量等关键推理指标上展现出超越英伟达H100/H800的卓越效率。这一性能突破得益于华为独特的统一总线(UB)网络互联架构和全栈软件优化,为大模型的高效部署和AI算力竞争格局带来了新的可能性。
阅读全文
洞察 Insights
腾讯混元开源MoE模型:在AI智能体与长文本理解领域的效率革新
腾讯混元发布了其首款开源MoE模型Hunyuan-A13B,该模型以800亿总参数、130亿激活参数的稀疏架构,在实现高性能的同时显著提升了推理速度和成本效益。Hunyuan-A13B在AI Agent工具调用和长文本理解方面表现突出,并通过开源新评估数据集推动了AI Agent技术和代码生成评估标准的进步,为AI的普惠化应用与发展注入了新动力。
阅读全文
洞察 Insights
稀疏激活的力量:蚂蚁Ring-lite如何重塑轻量级AI推理的格局
蚂蚁技术团队近日开源了轻量级MoE推理模型Ring-lite,该模型以其16.8亿总参数和仅2.75亿激活参数的精巧设计,在多项推理任务中实现了SOTA性能。其核心创新包括独创的C3PO强化学习训练方法和对多领域数据联合训练的优化,并承诺实现模型全链路的透明化开源,预示着高效、普惠与可信赖AI的新方向。
阅读全文