走出数字西西弗斯：持续学习如何打破大模型的“冻结”宿命

TL;DR：

伯克利等机构提出的FST（快慢学习）框架，通过模拟人类大脑的记忆分层机制，首次在工程层面实现了大模型的持续学习。这一突破有望终结大模型“训练即终点”的静态时代，让AI进化为能够实时适应环境的动态智能体。

从“天才鹦鹉”到持续学习者

过去两年的AI叙事，被牢牢锁死在“推理能力”的单调维度上。从OpenAI的o系列到DeepSeek R1，整个行业达成了一种近乎执拗的共识：只要模型想得足够深，智能就会涌现。然而，这种逻辑掩盖了一个残酷的真相——我们正在构建一群拥有顶级智商，却患有严重“失忆症”的天才。

目前的LLM在每一次对话结束时，都会被重置为“出厂设置”。它们如同加缪笔下的西西弗斯，在推理的巨石上反复攀爬，却永远无法将攀登过程中获取的经验沉淀为长久的智慧。当模型的可塑性（plasticity）随着训练的深入而枯竭，当“灾难性遗忘”将新学到的技能转化为旧知识的抹除，我们必须反思：如果不具备持续进化的能力，这种精致的计算真的能被称为“智能”吗？

技术原理：大脑的“快慢分工”

伯克利团队联合推出的“快慢训练”（Fast-Slow Training, FST）框架，本质上是一场针对AI架构的“认知革命”。该框架巧妙地借鉴了认知科学中的“互补学习系统”（Complementary Learning Systems）理论，将模型的参数权重进行了精细的分层：

慢权重（Slow Weights）： 对应人类的新皮层。通过强化学习（RL）进行缓慢更新，负责维持模型的通用推理能力和核心逻辑框架，确保模型不会因新任务的涌入而“崩塌”。
快权重（Fast Weights）： 对应人类的海马体。通过GEPA（生成进化提示算法）在上下文层面对提示词进行快速演化，负责对当前任务的即时适应和反馈吸收。

这种机制彻底改变了传统训练中“一组参数承担一切”的困境。实验证明，FST框架不仅在数据效率上提升了3倍，更关键的是，它成功保留了模型的可塑性——即使在连续处理多项完全不同的任务时，模型依然保持了对新知识的学习能力，而不再是“学新忘旧”。¹²

产业格局与商业叙事：从“一次性产品”到“进化型服务”

FST框架的提出，对于AI商业生态的意义是颠覆性的。在当前的商业模式下，模型发布即意味着训练结束，用户的数据反馈大多停留在对模型进行“修补”的层面，而非“增量学习”。

一旦持续学习成为可能，AI的商业逻辑将发生剧变：

个性化与即时进化： 部署在企业端的AI Agent将不再是冷冰冰的预训练模型，而是能够随着业务流程的变动、团队工作习惯的改变，在运行中不断“自我进化”的动态系统。
算力价值重构： 过去追求“暴力堆砌”的训练模式将向“高效率持续演进”转型。企业不再需要耗资数亿美元反复进行全量微调，而是通过轻量级的快权重更新，即可实现行业级的定制化。
AGI的新定义： 正如Ilya Sutskever所言，持续学习是通往超级智能的必经之路。如果AI能够像人一样在交互中学习，它将从一个“工具”演变为一个真正的“工作伙伴”。

未来展望：逃离“智能停滞”的陷阱

虽然FST目前仍处于初步的工程化阶段，但它为我们揭示了一条明确的演进路径：AI的下一个纪元，将是“在线学习”的时代。

从2024年的推理竞速到2026年即将爆发的持续学习浪潮，技术演进的逻辑已从“规模驱动”转向“结构驱动”。我们正在见证一种深层的变革——AI不再试图通过无限增大参数规模来解决所有问题，而是开始模拟生物智能的精妙分工。这种回归本质的范式转换，或许正是我们将AI从“会做题的鹦鹉”真正引导向“会成长的智慧生命”的关键转折点。

引用

Learning, Fast and Slow: Towards LLMs That Adapt Continually·arXiv·Rishabh Tiwari et al.（2026/05/13）·检索日期2026/05/19 ↩︎
Learning, Fast and Slow: Towards LLMs That Adapt Continually·alphaXiv·（2026/05/13）·检索日期2026/05/19 ↩︎