洞察 Insights

GPT-5遭遇“博士级”推理滑铁卢：从幻象到现实的AI能力边界审视

最新FormulaOne基准测试表明，包括GPT-5在内的前沿大模型在深层算法推理方面存在显著局限性，特别是在处理多步不确定性和复杂状态设计问题时表现不佳，这与Sam Altman宣称的“博士级AI”愿景形成反差。该结果强调了AI能力评估需超越竞赛编程，聚焦实际科研难题，并促使行业思考从通用智能转向更务实、更具深度的“人工专家智能”发展路径，以应对现实世界的复杂挑战。

阅读全文