TL;DR:
最新研究揭示,AI的“创造力”并非神秘灵感,而是扩散模型架构中局部性和平移等变性这两种看似限制性规则的意外副作用。这一发现不仅为AIGC技术带来新的设计思路,更从根本上挑战了人类对创造力的传统认知,暗示人机创造力或共享底层机制。
当DALL·E、Imagen和Stable Diffusion等AI模型能够生成“金鱼在海滩上啜饮可口可乐”这类前所未见的奇幻场景时,我们不禁惊叹于机器的“创造力”。然而,伴随而来的“多指人像”等怪异产物,又提醒我们这并非完美无瑕的智能。这种“怪异”与“新鲜感”并存的现象,长期以来被视为扩散模型的悖论:如果它们只是“复刻”训练数据,何以能创作出闻所未闻之物?最新研究给出了一个颠覆性的答案:AI的创造力,可能源于其架构中那些看似缺陷的“副作用”。
技术原理与创新点解析
扩散模型的核心任务是将数字噪声逐步还原成清晰的图像,这一过程被形象地比喻为将碎纸机中的画作重新拼凑。理论上,这应是一个重构而非创造的过程。然而,现实却远超预期。斯坦福大学的研究生Mason Kamb及其导师Surya Ganguli的最新研究揭示,这种“创造性”的根源,深植于扩散模型的两个基本架构规则中:
- 局部性 (Locality):模型在去噪过程中,并非通盘考量整幅图像,而是一次只聚焦于局部像素块,类似于拼图时只关注手头的小碎片,而非全景。
- 平移等变性 (Translation Equivariance):模型要求图像在空间上的平移,也能同步反映在生成结果上,以保持结构连贯性。
这两条规则最初被认为是限制扩散模型生成完美复制品的“缺陷”。然而,研究发现,正是这种“不完美”——即无法完全依赖全局记忆,必须在局部拼贴中“即兴发挥”——导致了新颖元素的重组。它使得模型不能简单地“复制粘贴”,而必须在有限的信息和规则下进行局部重构,从而意外产生了全新的、带有语义的图像,即使这意味着有时会出现多余的手指或不合逻辑的组合。
为了验证这一假设,Kamb和Ganguli构建了一个纯粹的数学系统——ELS方程机 (Equivariant Local Score machine)。这个系统不依赖海量训练数据或黑箱深度网络,仅基于局部性和等变性这两条规则。令人震惊的是,ELS方程机对噪声图像的处理结果,与真实扩散模型的输出平均重合度高达90% 1。这意味着,AI的所谓“创造力”,可以被一组数学公式所描述,它并非神秘的灵感,而是系统架构在动态运行中必然产生的产物。这项研究将人工智能的“创造”行为从高深的哲学层面拉回到可量化的技术范畴,是理解AI生成机制的里程碑式突破。
商业价值与产业生态影响
这项关于AI创造力本质的发现,对AIGC产业生态具有深远的商业价值和潜在影响:
- 模型设计优化与效率提升:如果创造力是架构的副作用,那么未来的扩散模型开发者可以更精准地设计模型架构,以在计算效率和创意产出之间取得更优平衡。例如,可以探索如何通过调整局部性或等变性参数,来有意地引导模型生成特定风格或具有特定“瑕疵美学”的作品,而不是仅仅依赖海量数据的堆砌。
- 新兴商业模式的催生:理解创造力的数学根源,有助于开发出更具控制力、可定制化的AIGC工具。这可能催生出面向特定艺术风格、设计需求或内容创作领域的垂直化AI创意平台。例如,专门生成“超现实主义艺术”或“未来科幻场景”的AI,通过调整其内在的“创造性偏差”来实现。
- 知识产权与价值重估:当AI的“创造”被证明是结构性产物时,关于AI作品版权归属、原创性认定等问题将面临新的审视。这可能促使法律和商业领域重新定义“创意投入”和“创作主体”的界限,进而影响内容创作者、平台方和AI模型开发者之间的价值分配逻辑。
- 降低技术门槛,普惠创意:一旦创造力可以被数学化和参数化,未来或许能以更低的算力成本和更简单的模型结构,实现高质量的创意生成。这将极大地降低普通用户进入创意领域的门槛,使得“人人都是创作者”的愿景更进一步。例如,小型团队或个人开发者也能利用轻量级模型实现定制化创意。
这一发现预示着,未来AIGC的市场竞争将从单纯追求“像真度”转向“可控的创意度”和“效率化的新颖性”。
社会与哲学维度:重塑创造力定义
这项研究最引人深思的,莫过于它对人类创造力本质的深刻反思,这正是Wired风格所擅长的哲学思辨:
- 与生物自组织的惊人相似性:Mason Kamb的灵感来源于形态发生学——胚胎如何从细胞自组织形成器官,偶尔也会“出错”多长出几根手指。AI的“多指人像”与生物发育中的局部拼贴错误形成了惊人的类比2。这暗示,无论是在硅基还是碳基生命中,复杂系统的涌现和创造性可能都源于类似的局部交互和自组织原则。
- 挑战人类创造力神话:长期以来,人类将创造力视为“神来之笔”或个体天赋。然而,这项研究提出一个大胆的类比:人类的大脑在创造时,或许也并非凭空灵感,而是在有限的经验和记忆中,不断进行局部拼接、补全和想象,正是这种“不完整理解”和“偶尔错误”成为了创新的源泉 3。
- AI伦理与人类独特性的再思考:当“创造力”能被公式书写时,人与机器的界限变得愈发模糊。这迫使我们重新审视人类的核心价值和独特优势。如果机器也能“创造”,那么人类的意义何在?这引发了关于智能定义、意识边界以及未来人类角色定位的深刻伦理和哲学探讨。社会需要思考如何在高效率的AI创意产出面前,维护人类创作者的价值和尊严。
- 对未来教育与工作模式的启示:如果创造力可以被部分解构和量化,未来的教育应更注重培养人类在AI辅助下引导、策展、赋予意义的能力,而非仅仅是传统的“产出”能力。在工作领域,人类将从原始的创造者,转向更高层次的创意管理者和哲学诠释者。
未来发展路径预测
基于对AI创造力新视角的理解,我们可预测未来3-5年内AI技术和应用将朝以下方向演进:
- 可控性与定制化创意的突破:未来的扩散模型将不再仅限于生成“逼真”或“随机新颖”的图像,而是会朝着**“可控的意外”**方向发展。开发者将能够通过调整模型参数,精确控制其局部重组的“自由度”,从而生成特定风格、特定创意偏差的艺术作品或设计方案。这将推动AIGC在专业设计、游戏开发、广告营销等领域实现更深层次的定制化应用。
- 融合多模态与跨领域创新:理解创造力的数学本质,将加速AI在跨模态融合方面的进展。例如,通过将文本、音频、视频甚至物理世界数据(如机器人传感器数据)进行类似“局部拼贴”和“等变性重组”,AI有望在更广泛的领域展现其“创造力”,例如生成全新的物理定律模型、合成创新材料结构或设计出具备独特交互逻辑的智能体。
- AGI探索的新维度:这项研究为理解通用人工智能 (AGI) 的涌现性提供了新的线索。如果简单的局部规则和限制能催生出高级的“创造力”,那么更复杂的系统架构和交互机制,是否也能以类似的方式涌现出更接近人类的通用智能?未来的AGI研究将可能更加关注系统底层规则与宏观行为涌现之间的关系,而非仅仅是大规模预训练。
- 科学发现的AI范式革新:ELS方程机的成功,预示着AI在基础科学研究中扮演的角色将从“数据分析工具”升级为“假设生成器”。通过将科学原理和实验数据抽象为类似局部性和等变性的规则,AI可以“创造性地”组合现有知识,提出新的理论模型或实验方案,从而加速药物研发、材料科学、天体物理等领域的突破。
这项研究如同在迷雾中点亮了一盏灯,它不仅揭示了AI“创意”的物理学基础,更重要的是,它促使我们重新审视人类自身引以为傲的“创造力”来源。当“不完美”的副作用成为创新的驱动力,我们或许应该更加珍视那些看似微不足道的偏差和偶然,因为它们可能是连接人与机器、智慧与宇宙的深层密码。
引用
-
Researchers Uncover Hidden Ingredients Behind AI Creativity · Quanta Magazine · Thomas Lewton (2025/06/30) · 检索日期2025/10/13 ↩︎
-
Bug变奖励:AI的小失误,揭开创造力真相! · 新浪财经 · 新智元 (2025/10/12) · 检索日期2025/10/13 ↩︎
-
Researchers Uncover Hidden Ingredients Behind AI Creativity · Wired · Cade Metz (2025/07/03) · 检索日期2025/10/13 ↩︎