洞察 Insights
GDPval:丈量AI经济价值的新标尺,重塑未来工作版图
OpenAI最新发布的GDPval基准测试,首次以经济价值衡量AI模型在44种高贡献职业任务中的表现。测试结果显示,Anthropic的Claude Opus 4.1以近50%的产出媲美人类专家,略胜OpenAI的GPT-5,揭示了前沿AI在专业知识工作领域的强大渗透力。这一里程碑不仅重塑了AI评估范式,更预示着人机协作将成为未来工作主流,并加速AI对全球经济格局的深层影响。
阅读全文
洞察 Insights
超越考试:OpenAI GDPval如何以3万亿美元坐标重塑AI评估与未来工作范式
OpenAI推出的GDPval评估体系,将AI能力测量从传统基准测试拓展到覆盖9大行业、44种职业、价值3万亿美元的真实经济任务,标志着AI评估进入以经济价值为核心的新范式。该体系揭示,领先AI模型已能在近半数专业任务上媲美人类,且成本效率远超人类,预示着AI正加速成为“后人类经济时代”的核心生产要素,并将深刻重塑全球劳动力市场与商业生态。
阅读全文