Newspaper

20250717日报|幻觉与真知：AI狂飙突进，却在深层理解与实际效能上撞墙？

今天是2025年07月17日。当AI狂热追逐“星辰大海”时，它正步入“幻觉与真知”的交锋期：Pusa V1.0以革命性低成本颠覆视频生成，PresentAgent重塑沟通范式，展现AI巨大潜力；但IneqMath无情揭露大模型在数学推理上“蒙对非理解”，AI编码工具反令资深开发者效率下降，警示其在深层理解和复杂情境中的局限，促使我们更务实地审视AI的真实能力与未来发展。

阅读全文

洞察 Insights

大语言模型如何被一场古老棋局“考倒”：ChatGPT与“理解”的边界

一场ChatGPT与1979年《Video Chess》的对局以大语言模型惨败告终，暴露了其在处理离散、规则严格的状态追踪任务上的固有弱点。此次事件引发了对当前AI能力，尤其是LLM“理解”边界的深刻反思，提醒业界和公众需更清醒地认识到AI的局限性，并呼吁构建更符合任务需求的混合AI系统。

阅读全文