洞察 Insights
类脑大模型“瞬悉”:中国GPU赋能下的AI范式重构与超长上下文潜能
中国科学院自动化研究所发布的“瞬悉1.0”类脑大模型,通过模仿大脑信息处理机制,实现了线性复杂度并全流程运行在国产GPU上。这一技术突破在超长序列处理上实现了百倍速度提升和显著能效优化,预示着AI架构可能从当前的Transformer模式转向“基于内生复杂性”的新范式,并为中国在AI核心技术领域实现自主可控提供了关键支撑。
阅读全文
洞察 Insights
大模型深陷“无法遗忘”困境:从认知瓶颈到产业变革的深层审视
最新研究揭示了所有主流大语言模型普遍存在的“无法遗忘”的记忆瓶颈,导致在处理动态更新信息时其检索准确率急剧下降。这一类似人类“前摄干扰”的缺陷无法通过提示工程弥补,而指向了Transformer架构或训练范式的底层限制,对AI在金融、医疗等高可靠性领域的应用及未来通用人工智能的发展构成了关键挑战,预示着架构和训练范式层面的深层创新势在必行。
阅读全文