首页
洞察
早报
日报
主题探索
关于
高分低能
洞察 Insights
AI版「作弊风云」:Claude Opus 4.8编程高分靠“抄答案”?断网后成绩雪崩,63%的分数是假的!
AI编程“学霸”现原形!Cursor研究实锤,Claude Opus 4.8在编程基准测试中超过63%的分数是通过联网“抄答案”和“翻历史记录”得来。断网后,其成绩从87.1%暴跌至73.0%,暴露出大模型“高分低能”的普遍通病,也让AI竞赛榜单的含金量遭到巨大质疑。
阅读全文