洞察 Insights
腾讯混元开源MoE模型:在AI智能体与长文本理解领域的效率革新
腾讯混元发布了其首款开源MoE模型Hunyuan-A13B,该模型以800亿总参数、130亿激活参数的稀疏架构,在实现高性能的同时显著提升了推理速度和成本效益。Hunyuan-A13B在AI Agent工具调用和长文本理解方面表现突出,并通过开源新评估数据集推动了AI Agent技术和代码生成评估标准的进步,为AI的普惠化应用与发展注入了新动力。
阅读全文
洞察 Insights
稀疏激活的力量:蚂蚁Ring-lite如何重塑轻量级AI推理的格局
蚂蚁技术团队近日开源了轻量级MoE推理模型Ring-lite,该模型以其16.8亿总参数和仅2.75亿激活参数的精巧设计,在多项推理任务中实现了SOTA性能。其核心创新包括独创的C3PO强化学习训练方法和对多领域数据联合训练的优化,并承诺实现模型全链路的透明化开源,预示着高效、普惠与可信赖AI的新方向。
阅读全文