AI早报 2026年05月12日

今天是2026年05月12日，AI能力边界被击穿的一天，能力评测尺子已不够用，行业范式正在加速转变。

能力评测“爆表”：Claude Mythos在METR评测中轻松完成人类需16小时的工作，其进化速度已超越2027年AGI的预测线，现有测评体系已无法衡量其真实能力。
数学界震动：GPT-5.5 Pro在17分钟内独立解决博士级数学难题，导致菲尔兹奖得主零贡献“躺赢”，引发学界对基础研究门槛与AI协作哲学的深度焦虑。
AI审计重塑安全：安全公司利用AI辅助工具，在数小时内挖掘出GitHub致命漏洞，标志着闭源软件的“复杂性安全护城河”已基本失效。
算力巨头的生态野心：英伟达通过数百亿美元的投资，将自己从GPU供应商变成AI生态的“总承包商”，其循环投资模式正在加固市场垄断。
DeepSeek的战略转型：以近500亿美元估值完成融资，其定位正在超越模型公司，转向构建不依赖英伟达的中国自主算力基础设施。
人机交互格式进化：由于AI任务趋于复杂，可交互的HTML正在取代静态Markdown，成为AI Agent与人类协作的下一代接口标准。
推理效率范式突破：伯克利的自适应并行推理（APR）技术，让AI能够根据任务难度自主切换并行与串行推理模式，旨在终结“思考等待”。
苹果硬件战略调整：其研发中的带摄像头的AI耳机旨在实现“环境智能”，却因隐私法规面临不确定性，凸显端侧AI硬件落地的监管博弈。
机器人生态仍处表演期：当前人形机器人应用商店多以舞蹈等固化动作为主，距离解决通用任务的“生产力工具”仍有关键差距。
硬件交互底层重塑：AI正在将键盘从字符输入工具转变为“意图触发”中枢，交互范式正从指令执行转向意图感知。

【今日总结】 AI的自主化能力已呈超指数级爆发，不仅测不准、卷得动数学界，更快速瓦解了传统软件安全和商业模式，行业正经历从技术到生态的深刻重构。