04-06日报 | 算力沙皇的6000亿豪赌,与手机里的“0 Token”革命

温故智新AIGC实验室

今天是2026年04月06日。AI 圈正处于一种极其扭曲的“双相情感障碍”中:一边是奥特曼拿着 6000 亿美金试图在云端扮演上帝,甚至为了买 GPU 敢把 CFO 踢出群聊;另一边是谷歌 Gemma 4 已经在 iPhone 里把 Token 价格打到了零,试图让 AI 彻底平权。更恐怖的是,当我们还在纠结价格和算力时,Claude 已经用 4 小时“物理超度”了全球最安全的系统。欢迎来到 AI 的暴力美学时代,这里的进化不再以年计,而是以小时计。

今日速览

  • 端侧逆袭:谷歌 Gemma 4 突袭开源,iPhone 离线跑出 40 token/s,云端 API 厂商的“税收”根基动摇。
  • 安全破防:Claude 独立攻破 FreeBSD 内核级 RCE,网络安全正式从智力博弈降维成 Token 消耗战。
  • 算力沙皇:奥特曼开启 6650 亿美金“梭哈”模式,为了 GPT-6 几乎砍掉 OpenAI 所有支线任务。
  • 算力荒饥荒:Anthropic 陷入“收入越高越亏损”的怪圈,200 刀尊贵会员被迫遭遇 19 分钟限流。

[iPhone 也能跑“小 Gemini”了?谷歌 Gemma 4 突袭,卖 Token 的厂商已经开始流汗了]

【AI内参·锐评】 云端厂商的“收割季”还没正式开始,端侧模型就已经开始挖他们的地基了。

【事实速览】 谷歌发布开源模型 Gemma 4,主打“全模态+离线化”。通过官方 App 即可在 iPhone 17 Pro 上实现超过 40 token/s 的推理速度。该模型提供 2.3B 和 4.5B 等多个型号,支持原生处理图片、音频,甚至可以在断网状态下控制系统硬件。虽然在复杂 Coding Agent 任务上稍逊于 Qwen 3 Coder,但其 128k/256k 的超长上下文和极高的端侧能效比,预示着高频、简单任务正加速向本地迁移。

开发者必读】 如果你还在构建依赖昂贵 API 的轻量级应用,请立刻止损。Gemma 4 的出现意味着**“AI 逻辑本地化”**已经成熟。开发者应关注如何利用 Apple MLX 框架或 Android 的 AI Edge 管道,将基础的文本处理、多模态解析和指令遵循下放到端侧。这不仅能节省 90% 以上的 Token 成本,更能通过“零延迟”和“离线可用”创造出全新的用户体验。

【我们在想】 当手机端算力足以支撑 80% 的日常 AI 需求时,那些估值数亿、仅靠一层云端 API “套壳”的工具类公司,是否还有存在的逻辑?

【信息来源】


[Claude 4小时“物理超度”全球最安全系统!黑客界也要迎来“萨诺斯响指”了?]

【AI内参·锐评】 网络安全已经从“防御战”彻底变成了“算力消耗战”,人类专家正在沦为 AI 特种兵的“递刀者”。

【事实速览】 Google 研究员利用 Claude 在仅 4 小时内独立发现了 FreeBSD 内核的远程代码执行(RCE)漏洞。Claude 不仅自主配置了复杂的测试环境,还设计了多包策略绕过限制,最终实现无损攻击并获得 root 权限。数据显示,AI 的网络攻击能力每 5.7 个月翻一倍,而人类对零日漏洞的防御窗口正在被指数级压缩。

【背景与动机】 这不仅仅是一次漏洞挖掘,这是对**“专家级黑暗知识”**的暴力破解。FreeBSD 以安全著称,其内核逻辑极度复杂,以往需要国家级黑客团队数月的攻坚。Anthropic 让 Claude 展现出这种能力,背后暗示了其下一代模型在“逻辑链条深度”和“长程任务规划”上的恐怖进化,这也是硅谷巨头试图向五角大楼证明自己“战略价值”的一种侧写。

【我们在想】 如果 AI 可以用 4 小时攻破人类打磨 30 年的系统,那未来的“零日漏洞”是否会变成一种随取随用的廉价快消品?

【信息来源】


[GPT-6 还没影,硅谷先打起来了:一边狂烧 6000 亿,一边贵到“亲妈”都用不起]

【AI内参·锐评】 在 AI 巨头的世界里,不需要懂平衡的 CFO,只需要能从石头里榨出算力的“战时指挥官”。

【事实速览】 OpenAI 与 Anthropic 的竞争进入白热化。Sam Altman 被爆正绕过财务总监(CFO)Sarah Friar,强行签署高达 6650 亿美金的算力租赁合同,试图用暴力计算堆出 AGI。与此同时,Anthropic 虽然年化收入冲向 190 亿美金,却因预留算力不足和 Mythos 模型成本过高陷入“算力荒”,甚至对 200 美元月费的高端会员进行极度限流,毛利率被英伟达和云商蚕食。

【未来展望】 这种“烧钱速度”必然导致 AI 行业的财务断层。我们预测在 2026 年底前,OpenAI 将被迫完成人类历史上规模最大的 IPO,否则其万亿级别的租约将成为引爆硅谷的债务炸弹。而 Anthropic 若无法在 Mythos 的推理效率上取得突破,其“高质量路线”可能会在用户流失中迅速崩塌。

【我们在想】 当一个公司为了“买显卡”可以架空财务总监时,这究竟是疯狂的赌徒行径,还是对 AGI 降临前夜最深刻的洞察?

【信息来源】


[GPT-6 曝出“土豆”大瓜!性能暴涨 40% 冲刺 AGI]

【AI内参·锐评】 奥特曼不仅要把“土豆”煮熟,还要把所有竞争对手都煮进这锅汤里。

【事实速览】 OpenAI 代号为 “Spud”(土豆)的 GPT-6 模型传闻将于 4 月 14 日发布。为了冲刺 AGI,OpenAI 内部进行了惨烈的资源重组:产品部更名为“AGI 部署部”,高开疯走的 Sora 被无限期推迟。GPT-6 被爆具备 200 万超大上下文窗口,性能提升 40%,且原生集成图像、视频、音频和桌面级 Agent。

【弦外之音】 “土豆”的突袭是对 Anthropic 近期编程工具霸权的暴力回应。OpenAI 砍掉 Sora 释放了一个极其明确的信号:在算力短缺的战时,一切华而不实的“表现层”AI 都要为“底层逻辑”AI 让路。 这是一场为了保住第一宝座而进行的断臂求生。

【我们在想】 如果 GPT-6 真的完成了“AGI 的最后 20%”,那么目前所有基于 GPT-4/5 构建的应用层生态,是否会像面对推土机一样被瞬间铲平?

【信息来源】

【结语】 当奥特曼在云端用 6000 亿美金构建 AGI 神殿时,谷歌正在把 AI 变成每个人口袋里的廉价工具。这不是两个厂商的竞争,而是两种文明演化路径的博弈。2026 年 4 月,我们正站在这个十字路口:是走向极致的中心化霸权,还是迎接全民 0 Token 的自由时代?答案可能就藏在 4 月 14 日那颗“土豆”成熟的瞬间。