洞察 Insights

颠覆大模型后训练：RLMT如何以“思考”之力重塑AI未来格局

陈丹琦团队的RLMT框架通过让大模型生成并优化“思维链”，实现了8B小模型在通用任务上超越GPT-4o的性能，且仅需7K提示数据。这一突破颠覆了传统大模型后训练对海量数据的依赖，大幅降低了高性能AI的开发成本与门槛，预示着AI向更类人、更高效“系统2思维”进化的新范式，有望重塑AI产业格局，加速AGI的到来。

阅读全文