洞察 Insights
Meta“中训练”范式:AI Agent告别跑分时代,迈向自主世界模型的深层变革
Meta推出的“中训练”范式,通过让AI智能体从自身探索中学习并构建“世界模型”,有效解决了传统模仿学习与强化学习的反馈难题。这一创新不仅显著提升了Agent的泛化能力和参数效率,更预示着AI训练将迈入“预训练+中训练+后训练”的三段式新时代,加速通用Agent的落地与商业化进程,并可能催生出一种新的参数效率Scaling Law。
阅读全文
洞察 Insights
打破参数桎梏:一种仿生学模型如何重塑AI推理的未来
Sapient Intelligence研发的HRM模型,通过模仿人脑的分层与多时间尺度处理机制,仅用2700万参数和1000个训练样本,便在复杂推理任务上显著超越了DeepSeek和Claude等大型语言模型。这项突破性研究不仅挑战了AI领域对模型规模的依赖,还通过近似梯度、深度监督和自适应计算时间等创新,为构建更高效、可解释且具图灵完备性的AI推理系统开辟了新路径。
阅读全文