洞察 Insights
Meta LLM自举进化:探索迭代如何重塑通用智能的边界与商业范式
Meta Superintelligence Labs的ExIt技术实现了LLM的“单步训练,多步推理自我改进”,显著提升了模型性能并拓展了任务多样性,特别是RLE-bench上性能提升约22%。这项基于强化学习和自动课程学习的创新,预示着AI Agent向通用智能迈进的效率革命,有望降低AI训练成本、催生新型商业模式,并深刻影响人机协作的未来。
阅读全文