超越语言的桥梁：DeepMind Aeneas如何重塑我们与古文明的连接

TL;DR：

DeepMind最新发布的Aeneas模型，凭借其多模态生成神经网络和Transformer架构，以前所未有的速度和精度修复并解读古罗马铭文，开启了AI辅助人文研究的新篇章。这项突破不仅将加速考古学和历史学的研究进程，更深远地引发了我们对于知识本质、人类历史叙事以及AI在科学发现中角色的哲学思辨。

在古文明的遗迹中，残破的铭文如同时间留下的谜语，记载着千年前的日常生活、政治风云乃至个人情感。长久以来，解读这些模糊、残缺的文字，是考古学家和历史学家耗时耗力的严峻挑战。如今，DeepMind的最新力作——生成式AI模型Aeneas，以其在《自然》主刊上的亮相手段，正颠覆这一古老领域的传统范式，预示着人工智能与人文科学深度融合的未来。

Aeneas的诞生，不仅仅是一项技术上的胜利，它更像是一座横跨时间与空间的桥梁，将现代计算的精准与效率，赋能于对人类文明深层记忆的挖掘与重构。它不仅能让“古文明只剩下难解的语言”成为历史，更让“传说就成了永垂不朽的诗篇”得以重现。

技术原理与创新点解析

Aeneas（源自古希腊神话中的流浪英雄）是一个多模态生成式神经网络，旨在帮助历史学家更好地解读、归属和修复残缺文本。其核心创新在于能够同时处理文本和视觉信息，这是其前身Ithaca（2022年专注于古希腊铭文年代预测和文本补全）所不具备的显著进步¹。

Aeneas的底层架构采用了NLP领域的大杀器Transformer模型，这使其能够高效处理复杂的语言模式和上下文信息。模型通过将每一块铭文转化为一种独特的“历史指纹”——一种编码了文本内容、语言风格、来源时间地点以及与其他碑文关联性的嵌入（embeddings）——来识别文本间的深层联系²。这种基于嵌入的语境化机制，使得Aeneas能够在庞大的拉丁铭文集合中进行推理，并迅速检索出文本和语境相似的平行文本，将数小时甚至数周的人工检索工作压缩到几秒钟。

具体功能上，Aeneas展现出惊人的实用性：

年代和出处预测：它能以72%的准确率将铭文归入62个古代罗马行省之一，并将文本置于历史学家提供的日期范围内的13年内。在处理像古罗马皇帝奥古斯都的《功业记》这样存在学界争议的铭文时，Aeneas甚至能提供一个可能的日期分布直方图，反映学术辩论的差异，而非单一武断的预测，这体现了其谨慎的判断力和对历史复杂性的理解。
文本修复：Aeneas能以73%的准确率修复最多十个字符缺失的损坏铭文；即使在缺失长度未知的情况下，准确率也能达到58%。这大大提升了处理严重损坏材料的效率，使其成为史学家的通用工具。
多模态输入：作为首个利用多模态输入确定文本地理来源的模型，Aeneas能够同时分析铭文图像和文本内容，提供了更全面的信息维度。
适应性与开放性：Aeneas不仅适用于拉丁铭文，还可以适应其他古代语言、文字和媒介，从莎草纸到硬币。更重要的是，它作为一个开源软件发布，邀请全球考古学家进行调整，以应用于诸如中国西夏文、契丹文等失传古迹的解读，预示着其在全球文化遗产保护领域的广阔前景。

产业生态影响评估

Aeneas的出现，标志着**“AI for Science”乃至“AI for Humanities”领域的一个重要里程碑**。它将深刻重塑考古学和历史学的研究范式，并可能催生全新的知识服务产业：

研究效率的指数级提升：过去考古学家需要依赖其专业知识和记忆力，通过耗时且复杂的检索来识别相似文本，确定上下文。Aeneas的出现，将考古学家从繁重的文本检索工作中解放出来，使他们能将更多精力投入到更高层次的解释、批判性分析和深入研究中。这不仅是效率的提升，更是认知负荷的转移。
知识的民主化与全球化：Aeneas的开源，意味着全球范围内的研究者，特别是发展中国家或资源有限的机构，也能利用前沿AI工具来处理本地的文化遗产。这对于推动全球历史学界的合作与知识共享具有深远意义，例如中国考古学界已在积极探索“AI考古”课程和模型（如通古大模型）³。
新兴的“AI考古”与“数字人文”产业：随着AI技术在古籍修复、文物鉴定、遗址测绘等领域的深入应用，将涌现出专业的AI考古服务公司、数字人文平台，以及结合AI和历史专业知识的复合型人才需求。这将吸引更多资本和人才流入，形成一个新兴的产业生态。
改变学者技能树：未来的考古学家和历史学家，除了传统的田野调查和文献解读能力，将更需要具备与AI工具协作、理解模型输出、甚至参与模型训练和优化的能力。这是一种人机协同的全新工作模式。

“Aeneas给出了两个可能的日期范围，而不是单一的预测，反而说明了Aeneas能够历史辩论提供了一种新的、定量的方法。”² 这不仅是技术的精确，更是对历史学复杂性的尊重。

未来发展路径预测

展望未来3-5年，Aeneas所代表的AI技术在人文科学领域的应用将呈现以下趋势：

跨媒介与跨语言的泛化能力：Aeneas已显示出从铭文扩展到莎草纸、硬币的可能性。未来，这类多模态AI将能够处理更多样化的历史证据，包括古画、雕塑、手稿、地图等，实现真正意义上的**“历史大数据”集成与分析**。不同语言和文化背景的古文字，如古埃及象形文字、玛雅文字，也将受益于这类模型的泛化能力。
从“解读”到“洞察”的飞跃：当前的Aeneas主要侧重于修复和提供语境相似性。未来，我们可能会看到AI模型不仅能还原文本，还能通过对海量历史数据的深度学习，发现人类学者难以察觉的深层模式、社会网络、文化演变规律。例如，通过分析大量铭文中的词频、情感倾向和人物关系，构建出更宏大、更精微的古代社会图景。
增强型历史叙事与教育：结合AIGC（AI生成内容）技术，Aeneas及其后续模型可以将解读出的历史信息，转化为更具沉浸感和互动性的数字体验，如虚拟现实复原古城、交互式数字博物馆、AI生成历史纪录片脚本等。这将极大提升公众对历史的理解和兴趣，改变历史知识的传播方式。
伦理与治理的必要性：随着AI在历史解释中扮演更重要角色，关于AI偏见、数据质量、解释权归属和“历史真相”定义的伦理问题将日益突出。如果训练数据存在偏差，或模型算法引入了某种倾向性，可能导致对历史的误读甚至“篡改”。因此，对AI生成结果的批判性评估、模型的可解释性以及人类学者的最终审定，将是未来AI考古领域不可或缺的组成部分。行业标准和伦理指南的制定将成为关键。
人机共创的新范式：未来的历史研究将是人机协作的典范。AI负责海量信息的快速处理、模式识别和初步推断，而人类学者则负责提出假设、设计实验、进行深度批判性思考和最终的解释与叙事。AI将成为历史学家**“智能的副驾驶”**，而非简单的替代者。

Aeneas并非仅仅是考古学工具的升级，它是AI触达人类文明核心记忆、重塑我们理解自身过去方式的一次深刻尝试。这不仅仅关乎技术，更关乎知识的生产、传播与解释的未来，以及人类在海量数据面前，如何借助智能的力量，更好地理解我们从何而来，又将去往何方。

引用

AI「解码」古罗马，重现千年铭文真相！DeepMind新模型再登 Nature·新智元·peter东英智（2025/8/9）·检索日期2025/8/12 ↩︎
Aeneas Transforms How Historians Connect The Past·DeepMind Blog·DeepMind Researchers (2025/7/24)·检索日期2025/8/12 ↩︎ ↩︎
AI「解码」古罗马，重现千年铭文真相！DeepMind新模型再登 Nature·新智元·peter东英智（2025/8/9）·检索日期2025/8/12 ↩︎