洞察 Insights

谷歌“加量不加价”：Gemini 3.1 Pro 推理能力狂飙，OpenAI 这次压力给到了？

谷歌发布 Gemini 3.1 Pro，以翻倍的推理性能和不变的价格震撼业界，ARC-AGI-2 跑分远超竞品。谷歌通过“加量不加价”的策略，意图在 AI 推理时代重新定义竞争规则并加速商业落地。

洞察 Insights

追逐AI的“底层逻辑”：Eve Bodnia与她的能量模型革命

Eve Bodnia 携手 AI 巨擘 Yann LeCun，通过创立 Logical Intelligence 挑战主流的自回归模型，致力于研发基于能量的推理模型（EBMs）。她主张 AI 应从单纯的概率预测转向严密的逻辑约束，试图解决 AI 幻觉问题，为 AGI 的实现开辟一条更稳健、可信的技术路径。

阅读全文

洞察 Insights

多模态AI的数学困境：从图像到形式化证明，准确率仅4%揭示深层推理鸿沟

香港科技大学团队发布的MATP-BENCH基准测试显示，当前多模态大模型（MLLMs）在理解图文结合的数学问题并将其形式化方面表现尚可（45%成功率），但在构建完整、可验证的形式化证明时，其成功率骤降至仅4%，暴露出模型在严谨逻辑推理和辅助线构造等深层能力上的显著不足，这指明了AI在迈向真正智能道路上的关键瓶颈。

阅读全文