洞察 Insights

GDPval：丈量AI经济价值的新标尺，重塑未来工作版图

OpenAI最新发布的GDPval基准测试，首次以经济价值衡量AI模型在44种高贡献职业任务中的表现。测试结果显示，Anthropic的Claude Opus 4.1以近50%的产出媲美人类专家，略胜OpenAI的GPT-5，揭示了前沿AI在专业知识工作领域的强大渗透力。这一里程碑不仅重塑了AI评估范式，更预示着人机协作将成为未来工作主流，并加速AI对全球经济格局的深层影响。

阅读全文

洞察 Insights

超越考试：OpenAI GDPval如何以3万亿美元坐标重塑AI评估与未来工作范式

OpenAI推出的GDPval评估体系，将AI能力测量从传统基准测试拓展到覆盖9大行业、44种职业、价值3万亿美元的真实经济任务，标志着AI评估进入以经济价值为核心的新范式。该体系揭示，领先AI模型已能在近半数专业任务上媲美人类，且成本效率远超人类，预示着AI正加速成为“后人类经济时代”的核心生产要素，并将深刻重塑全球劳动力市场与商业生态。

阅读全文