从“买显卡”到“造Token”:黄仁勋与吴泳铭隔空对暗号,2026成了“代币元年”?

温故智新AIGC实验室

TL;DR:

别再盯着GPU参数流口水了,老黄和老吴已经把AI这门生意玩明白了:以后不卖算力,改卖“代币(Token)”。英伟达变身“万亿级Token代工厂”,阿里直接成立“Token事业群”,2026年,AI圈的硬通货正式确立,没个“/1M tokens”的后缀,你都不好意思出来混。

美国旧金山,GTC 2026现场。当穿着标志性皮衣的黄仁勋(Jensen Huang)在台上口若悬河两个小时,台下观众听到的最高频词汇不是“GPU”,也不是“算力”,而是那个原本属于语言学和区块链的词儿——Token

与此同时,大洋彼岸的杭州,阿里CEO吴泳铭(吴妈)也没闲着。阿里宣布成立“Token事业群(ATH)”,地位直接平齐淘天和阿里云。两家巨头虽然隔着太平洋,却像商量好了一样,在Agent时代来临前夕,共同喊出了同一个英文单词。

简单科普一下,Token是大模型处理信息的“基本单位”。你可以把它理解为AI世界的“口粮”或者“乐高积木”。你输入一句话,模型先把它拆成一堆Token,然后扔进GPU里一通乱算。

“老黄”的算盘:数据中心关门,Token工厂开张

如果说以前的英伟达是卖“挖掘机”的,那现在的黄仁勋想告诉全世界:我其实是开“罐头工厂”的。

老黄在GTC演讲中抛出了一个极其“炸裂”的构想——从数据中心到Token工厂1 在他看来,未来的AI企业收入将直接挂钩Token的产出:算力多,Token多,钱就多。为此,他把2026年的采购目标直接从5000亿美元翻倍到了1万亿美元

为了让这门生意更像“大宗商品”,老黄甚至搞出了一套“Token经济学”,给Token分了级:

  • 免费层:高吞吐低速,靠广告恰饭;
  • 付费层:主流应用,每百万Token收3到6刀;
  • 超级跑车层:极低延迟,针对RUBIN架构的高价值推理,最高敢报到每百万Token 150刀。2

老黄甚至开玩笑说,未来硅谷求职,大家不谈股权了,改谈“Token配额”,入职即送10亿流量。

技术大揭秘:Vera Rubin 并非只是“堆料”

为了撑起这个万亿级的工厂梦,英伟达祭出了大招:Vera Rubin架构。这玩意儿不是一块芯片,而是一整套“全家桶”。

这里有个技术细节:英伟达此前“收编”了Groq平台,并将其融入了这次的系统。1 为什么要搞得这么复杂?因为AI进入Agent(智能体)时代后,原本的GPU在“吐字”(生成Token)时会遇到“内存墙”瓶颈。

于是,英伟达整了一套“异构协同”的骚操作:

  1. GPU负责“吞”:处理前期的预填充(Prefill)计算;
  2. Groq LPU负责“吐”:专注搞定解码和生成,解决延迟问题;
  3. Vera CPU负责“管”:首次把手机里的低功耗LPDDR5内存塞进数据中心,当调度员。2

为了让这一堆不同脾气的硬件和谐共处,英伟达还专门开发了一个叫Dynamo的操作系统。老黄建议,如果是普通活儿,100%用Rubin;要是高端代码生成,就得加25%的Groq“黑科技”。1

阿里与OpenClaw:当Agent开始“乱花钱”

回过头来看阿里。吴泳铭直言:“AI Agent极度依赖Token,未来将进入需求大爆炸时期。”1 阿里成立Token事业群,核心逻辑就是六个字:创造、输送、应用

为什么大家突然这么关心Token?因为AI不再只是陪你聊天的机器人,它开始变成能帮你买票、写代码、管服务器的Agent了。而Agent干活,那可是真的一边操作一边烧Token。

这时候,安全就成了大问题。黄仁勋在会上狂Cue当下的开源神作OpenClaw2 这个项目被称为“智能体界的Linux”,短短几周就火遍全网。为了让企业敢用,英伟达推出了企业版NeMo Claw。它就像给Agent套上了一个“隐私路由器”,防止这些智能小助手在调用Token时,顺手把你公司的银行密码也给发出去了。

甚至,老黄还展望了**“太空算力”**。发布了Vera Rubin Space-1模块,准备把Token工厂开到卫星上去。以后我们在地球上发问,天上的卫星在真空里帮你“吐Token”。23

从DLSS 5带来的“图形学GPT时刻”,到阿里“悟空事业部”的首次曝光,2026年的GTC与其说是硬件发布会,不如说是AI商业化的“封禅大典”。当Token从一个技术术语变成像“石油”一样的大宗商品,这场万亿美金的工厂游戏,才刚刚开始。

引用


  1. 当黄仁勋和吴泳铭喊出同一个英文单词 · 36氪 · 邱晓芬 (2026/3/18) · 检索日期2026/3/18 ↩︎ ↩︎ ↩︎ ↩︎

  2. 从GPU到「Token工厂」,黄仁勋讲了一个万亿美元的AI未来 · 网易 · AI普瑞斯 (2026/3/18) · 检索日期2026/3/18 ↩︎ ↩︎ ↩︎ ↩︎

  3. 英伟达GTC:AI界春晚,满心期待、扫兴而归? · 虎嗅网 · 海豚君 (2026/3/17) · 检索日期2026/3/18 ↩︎