洞察 Insights
谷歌“加量不加价”:Gemini 3.1 Pro 推理能力狂飙,OpenAI 这次压力给到了?
谷歌发布 Gemini 3.1 Pro,以翻倍的推理性能和不变的价格震撼业界,ARC-AGI-2 跑分远超竞品。谷歌通过“加量不加价”的策略,意图在 AI 推理时代重新定义竞争规则并加速商业落地。
阅读全文
洞察 Insights
追逐AI的“底层逻辑”:Eve Bodnia与她的能量模型革命
Eve Bodnia 携手 AI 巨擘 Yann LeCun,通过创立 Logical Intelligence 挑战主流的自回归模型,致力于研发基于能量的推理模型(EBMs)。她主张 AI 应从单纯的概率预测转向严密的逻辑约束,试图解决 AI 幻觉问题,为 AGI 的实现开辟一条更稳健、可信的技术路径。
阅读全文
洞察 Insights
多模态AI的数学困境:从图像到形式化证明,准确率仅4%揭示深层推理鸿沟
香港科技大学团队发布的MATP-BENCH基准测试显示,当前多模态大模型(MLLMs)在理解图文结合的数学问题并将其形式化方面表现尚可(45%成功率),但在构建完整、可验证的形式化证明时,其成功率骤降至仅4%,暴露出模型在严谨逻辑推理和辅助线构造等深层能力上的显著不足,这指明了AI在迈向真正智能道路上的关键瓶颈。
阅读全文