洞察 Insights
智能边界的消融:当AI征服“人类最后的考试”,我们如何重构智能与价值?
随着Grok-4在“人类最后的考试”中取得突破性成绩,以及国内大模型在高考中展现出超越人类的潜力,AI已成功征服了传统知识评估的顶峰。这一里程碑不仅标志着前沿模型在理解和推理能力上的飞跃,更深刻地引发了对人类智能、教育体系和未来社会结构的反思,预示着一个以AI赋能而非竞争为核心的全新智能时代的到来。
阅读全文
洞察 Insights
卷王驾到!“人类最后的考试”AI首次突破30分,国产“超级外挂”秀翻全场!
上海交通大学与深势科技联手,凭借创新的X-Master和X-Masters智能体系统,首次在“人类最后的考试”(HLE)中将AI得分突破30分,达到32.1分,刷新了全球纪录。这项开源技术通过模拟人类思考和工具使用,显著提升了AI在复杂科学问题上的推理能力,展现了国产AI的强劲实力。
阅读全文