洞察 Insights
GPT-5遭遇“博士级”推理滑铁卢:从幻象到现实的AI能力边界审视
最新FormulaOne基准测试表明,包括GPT-5在内的前沿大模型在深层算法推理方面存在显著局限性,特别是在处理多步不确定性和复杂状态设计问题时表现不佳,这与Sam Altman宣称的“博士级AI”愿景形成反差。该结果强调了AI能力评估需超越竞赛编程,聚焦实际科研难题,并促使行业思考从通用智能转向更务实、更具深度的“人工专家智能”发展路径,以应对现实世界的复杂挑战。
阅读全文