首页
洞察
早报
日报
主题探索
关于
认知对齐
洞察 Insights
蒸馏悖论:大模型「名师」的幻觉与算法认知的本质回归
清华大学团队通过拆解On-Policy蒸馏的黑箱,揭示了“思维模式一致性”远比模型规模更重要,并指出高分模型未必具备高效教导学生的能力。这一洞察重塑了模型后训练的工程逻辑,为高效小模型的研发提供了核心算法处方。
阅读全文