当算法失语:从“谷歌拼不出Google”看大模型认知的深层边界

温故智新AIGC实验室

TL;DR:

谷歌搜索AI拼写错误反映了当前大语言模型(LLM)基于Token而非字符处理语义的根本性架构缺陷。这一“认知参差”不仅挑战了搜索引擎作为权威信息源的信誉,更预示着未来AI架构必须在计算效率与感知深度之间寻找新的平衡点。

从认知错位到系统性幻觉

近日,谷歌升级后的AI搜索功能因无法正确统计“Google”一词中的字母数量,在舆论场引发了广泛的嘲讽。然而,这并非简单的“AI犯蠢”,而是大模型底层运行机制的一次“公开处刑”。当AI将“Google”视为一个完整的Token(语义碎片)而非G-o-o-g-l-e的集合体时,它处理的本质是概率意义上的语言模式,而非人类逻辑下的物理符号排列。1

这种现象被研究者称为“参差不齐的智能”(Jagged Intelligence)。1 大模型在处理高阶逻辑、代码编写时表现出的惊人天赋,与其在字母计数、空间几何判断等基础任务上的笨拙,形成了剧烈的反差。这种反直觉的智能分布,揭示了当前Transformer架构的一个深层真相:AI处理的是语言的“意象”,而非文字的“形状”。

架构的代价:分词机制的囚徒困境

造成这一问题的核心,在于主流大模型依赖的“Tokenization(分词)”机制。12 为了提升运算效率,模型将文本切分为不同粒度的片段,这种压缩操作不可避免地导致了底层字符信息的丢失。正如人工智能研究者所指出的,要修复这一缺陷,最直接的手段是转向“字节级”模型,直接对底层字符进行序列处理。13

然而,商业世界有着残酷的算力账单。1 抛弃分词机制、直接处理字节意味着序列长度的指数级增长,这将带来惊人的计算开销。即便如Meta推出的Byte Latent Transformer(BLT)尝试通过动态分组优化效率,但在面对数千亿参数的生产级应用时,如何在“模拟人类阅读”与“维持计算边际成本”之间做出取舍,依然是摆在硅谷巨头面前的一道难题。14

搜索引擎的信誉重构

这次翻车事件对谷歌而言,有着更为深远的商业隐忧。1 搜索框作为过去25年互联网的“真理入口”,其核心价值在于准确性。当AI生成的概览(AI Overviews)取代了传统的链接列表,算法的每一次“幻觉”都会削弱用户对这一平台作为“权威来源”的信任。

  • 技术边界的警示:当AI模型被嵌入高可信度场景时,其“概率性产出”与“确定性需求”之间的结构性矛盾会被迅速放大。
  • 交互模式的重塑:从单纯的“搜索检索”向“智能对话”演进,迫使平台必须引入“认知自我知识”,即AI需学会识别自己的能力边界,并在必要时切换至计算器、代码解释器等外部确定性工具。1

未来展望:走出“语言陷阱”

未来3-5年,大模型的发展路径将不再仅仅追求参数量的规模效应,而是向“多模态认知深度”转型。1 我们正目睹一种趋势:从单一的Transformer预测模型,转向具备规划能力、能够调用外部工具(Tool-use)的Agent架构。1

谷歌当前的尴尬,正是AI从“语言生成器”向“可靠智力代理”跨越过程中的阵痛。这不仅是一个拼写问题,更是一个关于如何让AI理解物理世界逻辑的哲学课题。如果AI连单词的构造都无法感知,那么它对复杂世界真实性的构建又该如何保证?这注定是一场技术与认知深度之间长期的博弈。

引用


  1. 为什么 AI 数不清 Strawberry 里有几个 r?Karpathy:我用表情包给你解释一下 · 机器之心 · 2026/5/28 · 2026/5/28 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 大型语言模型简介 · Google for Developers · 2026/5/28 · 2026/5/28 ↩︎

  3. Why Google’s AI can’t spell ‘Google’ (or anything else) · TechCrunch · 2026/5/28 · 2026/5/28 ↩︎

  4. Meta 、芝加哥大学等机构联合发布无Token大语言模型BLT · 知乎 · 2026/5/28 · 2026/5/28 ↩︎