超越语言的桥梁:DeepMind Aeneas如何重塑我们与古文明的连接

温故智新AIGC实验室

TL;DR:

DeepMind最新发布的Aeneas模型,凭借其多模态生成神经网络和Transformer架构,以前所未有的速度和精度修复并解读古罗马铭文,开启了AI辅助人文研究的新篇章。这项突破不仅将加速考古学和历史学的研究进程,更深远地引发了我们对于知识本质、人类历史叙事以及AI在科学发现中角色的哲学思辨。

在古文明的遗迹中,残破的铭文如同时间留下的谜语,记载着千年前的日常生活、政治风云乃至个人情感。长久以来,解读这些模糊、残缺的文字,是考古学家和历史学家耗时耗力的严峻挑战。如今,DeepMind的最新力作——生成式AI模型Aeneas,以其在《自然》主刊上的亮相手段,正颠覆这一古老领域的传统范式,预示着人工智能与人文科学深度融合的未来。

Aeneas的诞生,不仅仅是一项技术上的胜利,它更像是一座横跨时间与空间的桥梁,将现代计算的精准与效率,赋能于对人类文明深层记忆的挖掘与重构。它不仅能让“古文明只剩下难解的语言”成为历史,更让“传说就成了永垂不朽的诗篇”得以重现。

技术原理与创新点解析

Aeneas(源自古希腊神话中的流浪英雄)是一个多模态生成式神经网络,旨在帮助历史学家更好地解读、归属和修复残缺文本。其核心创新在于能够同时处理文本和视觉信息,这是其前身Ithaca(2022年专注于古希腊铭文年代预测和文本补全)所不具备的显著进步1

Aeneas的底层架构采用了NLP领域的大杀器Transformer模型,这使其能够高效处理复杂的语言模式和上下文信息。模型通过将每一块铭文转化为一种独特的“历史指纹”——一种编码了文本内容、语言风格、来源时间地点以及与其他碑文关联性的嵌入(embeddings)——来识别文本间的深层联系2。这种基于嵌入的语境化机制,使得Aeneas能够在庞大的拉丁铭文集合中进行推理,并迅速检索出文本和语境相似的平行文本,将数小时甚至数周的人工检索工作压缩到几秒钟。

具体功能上,Aeneas展现出惊人的实用性:

  • 年代和出处预测:它能以72%的准确率将铭文归入62个古代罗马行省之一,并将文本置于历史学家提供的日期范围内的13年内。在处理像古罗马皇帝奥古斯都的《功业记》这样存在学界争议的铭文时,Aeneas甚至能提供一个可能的日期分布直方图,反映学术辩论的差异,而非单一武断的预测,这体现了其谨慎的判断力和对历史复杂性的理解。
  • 文本修复:Aeneas能以73%的准确率修复最多十个字符缺失的损坏铭文;即使在缺失长度未知的情况下,准确率也能达到58%。这大大提升了处理严重损坏材料的效率,使其成为史学家的通用工具。
  • 多模态输入:作为首个利用多模态输入确定文本地理来源的模型,Aeneas能够同时分析铭文图像和文本内容,提供了更全面的信息维度。
  • 适应性与开放性:Aeneas不仅适用于拉丁铭文,还可以适应其他古代语言、文字和媒介,从莎草纸到硬币。更重要的是,它作为一个开源软件发布,邀请全球考古学家进行调整,以应用于诸如中国西夏文、契丹文等失传古迹的解读,预示着其在全球文化遗产保护领域的广阔前景。

产业生态影响评估

Aeneas的出现,标志着**“AI for Science”乃至“AI for Humanities”领域的一个重要里程碑**。它将深刻重塑考古学和历史学的研究范式,并可能催生全新的知识服务产业:

  • 研究效率的指数级提升:过去考古学家需要依赖其专业知识和记忆力,通过耗时且复杂的检索来识别相似文本,确定上下文。Aeneas的出现,将考古学家从繁重的文本检索工作中解放出来,使他们能将更多精力投入到更高层次的解释、批判性分析和深入研究中。这不仅是效率的提升,更是认知负荷的转移
  • 知识的民主化与全球化:Aeneas的开源,意味着全球范围内的研究者,特别是发展中国家或资源有限的机构,也能利用前沿AI工具来处理本地的文化遗产。这对于推动全球历史学界的合作与知识共享具有深远意义,例如中国考古学界已在积极探索“AI考古”课程和模型(如通古大模型)3
  • 新兴的“AI考古”与“数字人文”产业:随着AI技术在古籍修复、文物鉴定、遗址测绘等领域的深入应用,将涌现出专业的AI考古服务公司、数字人文平台,以及结合AI和历史专业知识的复合型人才需求。这将吸引更多资本和人才流入,形成一个新兴的产业生态。
  • 改变学者技能树:未来的考古学家和历史学家,除了传统的田野调查和文献解读能力,将更需要具备与AI工具协作、理解模型输出、甚至参与模型训练和优化的能力。这是一种人机协同的全新工作模式。

“Aeneas给出了两个可能的日期范围,而不是单一的预测,反而说明了Aeneas能够历史辩论提供了一种新的、定量的方法。”2 这不仅是技术的精确,更是对历史学复杂性的尊重。

未来发展路径预测

展望未来3-5年,Aeneas所代表的AI技术在人文科学领域的应用将呈现以下趋势:

  • 跨媒介与跨语言的泛化能力:Aeneas已显示出从铭文扩展到莎草纸、硬币的可能性。未来,这类多模态AI将能够处理更多样化的历史证据,包括古画、雕塑、手稿、地图等,实现真正意义上的**“历史大数据”集成与分析**。不同语言和文化背景的古文字,如古埃及象形文字、玛雅文字,也将受益于这类模型的泛化能力。
  • 从“解读”到“洞察”的飞跃:当前的Aeneas主要侧重于修复和提供语境相似性。未来,我们可能会看到AI模型不仅能还原文本,还能通过对海量历史数据的深度学习,发现人类学者难以察觉的深层模式、社会网络、文化演变规律。例如,通过分析大量铭文中的词频、情感倾向和人物关系,构建出更宏大、更精微的古代社会图景。
  • 增强型历史叙事与教育:结合AIGC(AI生成内容)技术,Aeneas及其后续模型可以将解读出的历史信息,转化为更具沉浸感和互动性的数字体验,如虚拟现实复原古城、交互式数字博物馆、AI生成历史纪录片脚本等。这将极大提升公众对历史的理解和兴趣,改变历史知识的传播方式。
  • 伦理与治理的必要性:随着AI在历史解释中扮演更重要角色,关于AI偏见、数据质量、解释权归属和“历史真相”定义的伦理问题将日益突出。如果训练数据存在偏差,或模型算法引入了某种倾向性,可能导致对历史的误读甚至“篡改”。因此,对AI生成结果的批判性评估、模型的可解释性以及人类学者的最终审定,将是未来AI考古领域不可或缺的组成部分。行业标准和伦理指南的制定将成为关键。
  • 人机共创的新范式:未来的历史研究将是人机协作的典范。AI负责海量信息的快速处理、模式识别和初步推断,而人类学者则负责提出假设、设计实验、进行深度批判性思考和最终的解释与叙事。AI将成为历史学家**“智能的副驾驶”**,而非简单的替代者。

Aeneas并非仅仅是考古学工具的升级,它是AI触达人类文明核心记忆、重塑我们理解自身过去方式的一次深刻尝试。这不仅仅关乎技术,更关乎知识的生产、传播与解释的未来,以及人类在海量数据面前,如何借助智能的力量,更好地理解我们从何而来,又将去往何方。

引用


  1. AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登 Nature·新智元·peter东 英智(2025/8/9)·检索日期2025/8/12 ↩︎

  2. Aeneas Transforms How Historians Connect The Past·DeepMind Blog·DeepMind Researchers (2025/7/24)·检索日期2025/8/12 ↩︎ ↩︎

  3. AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登 Nature·新智元·peter东 英智(2025/8/9)·检索日期2025/8/12 ↩︎