洞察 Insights
腾讯混元开源MoE模型:在AI智能体与长文本理解领域的效率革新
腾讯混元发布了其首款开源MoE模型Hunyuan-A13B,该模型以800亿总参数、130亿激活参数的稀疏架构,在实现高性能的同时显著提升了推理速度和成本效益。Hunyuan-A13B在AI Agent工具调用和长文本理解方面表现突出,并通过开源新评估数据集推动了AI Agent技术和代码生成评估标准的进步,为AI的普惠化应用与发展注入了新动力。
阅读全文
洞察 Insights
集体智能的崛起:GRA框架如何赋能小模型“逆袭”大模型,重塑AI开发图景
上海人工智能实验室与中国人民大学推出的GRA框架,通过模拟学术审稿流程,使多个小型语言模型(7B级别)协同生成高质量训练数据,性能可媲美甚至超越72B大模型蒸馏的效果。这项开源技术为AI模型的开发提供了一种更经济高效、更具普惠性的新范式,有望打破当前对大规模参数模型的过度依赖,促进AI领域的民主化和可持续发展。
阅读全文