Aeneas 改变了历史学家连接过去的方式
摘要
Google DeepMind 推出 Aeneas,这是第一个用于理解古代拉丁铭文的 AI 模型,帮助历史学家识别相似之处、恢复残缺文本和解释历史证据。该模型可免费供研究人员和学者在 predictingthepast.com 使用,并公开源代码和数据集。
介绍首个用于理解古代铭文的模型,旨在帮助历史学家更好地解释、归属和恢复残缺文本。
查看缓存全文
缓存时间: 2026/04/20 08:35
# Aeneas改变了历史学家连接过去的方式
来源:https://deepmind.google/blog/aeneas-transforms-how-historians-connect-the-past/
介绍首个用于古代铭文语境化的模型,旨在帮助历史学家更好地诠释、归属和恢复残缺文本。
书写在罗马世界无处不在——刻在从帝国纪念碑到日常物品的一切事物上。从政治涂鸦、爱情诗和墓志铭到商业交易、生日邀请和魔法咒语,铭文为现代历史学家提供了对罗马世界日常生活多样性的丰富洞察。
通常,这些文本是残缺的、风化的或被故意破坏的。没有上下文信息,尤其是在比较相似的铭文时,恢复、定年和定位它们几乎是不可能的。
今天,我们在《自然》杂志上发表了一篇论文,介绍Aeneas,这是第一个用于古代铭文语境化的人工智能(AI)模型。
在处理古代铭文时,历史学家传统上依靠他们的专业知识和专门资源来识别"平行文本"——即在措辞、句法、标准化公式或出处上有相似之处的文本。
Aeneas大大加速了这项复杂和耗时的工作。它在数千份拉丁铭文中推理,在几秒内检索出文本和语境平行文本,使历史学家能够诠释和建立在模型发现基础上。
我们的模型还可以适应其他古代语言、文字和媒介,从莎草纸到硬币,扩展其能力以帮助跨越更广泛的历史证据范围进行连接。
我们与诺丁汉大学共同开发了Aeneas,并与沃里克大学、牛津大学和雅典经济与商业大学(AUEB)的研究人员合作。这项工作是探索生成式AI如何帮助历史学家大规模识别和诠释平行文本的更广泛努力的一部分。
我们希望这项研究能造福尽可能多的人,因此我们在predictingthepast.com上免费提供Aeneas的交互式版本,供研究人员、学生、教育工作者、博物馆专业人士等使用。为了支持进一步的研究,我们还开源了我们的代码和数据集。
## Aeneas的先进功能
以希腊罗马神话中的流浪英雄命名,Aeneas建立在Ithaca的基础上,这是我们之前使用AI来恢复、定年和定位古代希腊铭文的工作。
Aeneas更进一步,帮助历史学家诠释和语境化文本、赋予孤立片段意义、得出更丰富的结论,并拼凑出对古代历史更好的理解。
我们模型的先进功能包括:
- **平行文本搜索:** 它在大量拉丁铭文中搜索平行文本。通过将每个文本转变为一种历史指纹,Aeneas识别出深层联系,可以帮助历史学家将铭文放在更广阔的历史语境中。
- **处理多模态输入:** Aeneas是第一个使用多模态输入确定文本地理出处的模型。它分析文本和视觉信息,如铭文的图像。
- **恢复未知长度的缺失部分:** Aeneas首次能够恢复长度未知的文本缺失部分。这使其成为处理严重受损材料的历史学家的更通用工具。
- **最先进的性能:** Aeneas在恢复受损文本和预测它们的书写时间和地点方面设置了新的最先进基准。
暗色、残缺的罗马青铜军事文件,上面有刻入的拉丁文,背景为白色
来自撒丁岛的已修复青铜军事文件的动画,113/14年CE。(*CIL*XVI, 60)。
## Aeneas如何工作
Aeneas是一个多模态生成式神经网络,将铭文的文本和图像作为输入。为了训练Aeneas,我们整理了一个庞大而可靠的数据集,利用历史学家数十年的工作来创建数字收藏,特别是《罗马铭文数据库》(EDR)、《海德堡铭文数据库》(EDH)和《克劳斯-斯拉比铭文数据库》(EDCS-ELT)。
我们清理、协调并将这些记录链接到一个单一的机器可处理数据集中,我们称之为《拉丁铭文数据集》(LED),包含来自整个古代罗马世界的176,000多份拉丁铭文。
我们的模型使用基于变换器的解码器来处理铭文的文本输入。专门的网络使用文本处理字符恢复和定年,而地理归属也将铭文的图像作为输入。解码器从LED中检索相似的铭文,按相关性排序。
对于每份铭文,Aeneas的语境化机制使用称为"嵌入"的技术检索平行文本列表——将每份铭文的文本和语境信息编码为一种历史指纹,包含文本内容、语言、来源时间和地点,以及它与其他铭文的关系的详细信息。
Aeneas架构图,显示模型如何接收文本和图像输入以生成省份、定年和恢复预测。
## 最先进的性能
Aeneas按书写日期将铭文分组的清晰度远高于其他也在拉丁语上训练的通用模型,如下面的可视化所示。
统一流形近似和投影(UMAP)可视化,说明Aeneas历史丰富的嵌入相比通用大语言模型文本嵌入的年代归属。
Aeneas以Top-20精度73%的成绩恢复多达十个字符的缺失部分的受损铭文。当恢复长度未知时,这仅下降到58%——本身就是一个非常具有挑战性的任务。它还以可解释的方式显示其推理,提供显示输入的哪些部分影响其预测的显著性图。由于其对视觉数据的使用,我们的模型可以以72%的精度将铭文归属于62个古代罗马省份之一。在定年方面,Aeneas将文本放在历史学家提供的日期范围内13年以内。
## 对历史辩论的新视角
为了测试Aeneas在一场进行中的研究辩论中的能力,我们给了它最著名的罗马铭文之一:《奥古斯都的成就录》——皇帝奥古斯都关于其成就的第一人称叙述。
历史学家一直在争论这份铭文的定年。Aeneas没有预测单一的固定日期,而是生成了可能日期的详细分布,显示两个不同的峰值,一个较小的峰值在公元前10-1年左右,一个更大、更有信心的峰值在公元10-20年之间。这些结果以定量方式捕捉了两种流行的定年假说。
显示Aeneas对《奥古斯都的成就录》年代归属预测的直方图,该模型对这份著名铭文的定年进行了学术辩论。
Aeneas基于微妙的语言特征和历史标记(如文本中提到的官方头衔和纪念碑)做出了其预测。通过将定年问题转变为以语言和语境数据为基础的概率估计,我们的模型提供了一种新的、量化的方式来参与长期存在的历史辩论。
最重要的是,Aeneas还检索了许多与奥古斯都遗产相关的帝国法律文本的相关平行文本,突出了帝国意识形态如何在媒介和地理中被再现。
## 以协作方式推进历史研究
为了评估Aeneas作为研究辅助工具的影响,我们进行了一项大规模的历史学家与AI协作研究。我们邀请了二十三位经常处理铭文工作的历史学家使用Aeneas来恢复、定年和定位一组文本。
我们的评估(如下表所示)显示了当历史学家将Aeneas的语境信息与其对恢复和归属罗马铭文的预测结合使用时,取得了最有效的成果。
表格显示历史学家在三项铭文学任务(恢复、地理归属、定年)上的表现,使用来自我们数据库测试集的60份铭文。任务首先独立执行,然后使用Aeneas的平行文本信息,或平行文本和预测一起使用。
Aeneas帮助我们研究中的历史学家识别新的平行文本,并增加了他们在处理复杂铭文学任务时的信心。历史学家一致强调了Aeneas在加速其工作和扩展最相关平行文本范围方面的价值。
> Aeneas的平行文本完全改变了我对这份铭文的看法。它注意到了对恢复和年代学归属文本起到关键作用的细节。
我们研究中的匿名历史学家
## 共享工具,塑造未来
Aeneas旨在集成到历史学家现有的研究工作流程中。通过将专业知识与机器学习相结合,它开启了一个协作过程,提供可解释的建议,作为历史探究的宝贵起点。
作为今天发布的一部分,我们正在升级Ithaca(我们的古代希腊模型),由Aeneas提供支持,包括语境化功能、未知长度的恢复和整体更好的性能。
我们还共同设计了一个新的教学大纲,用于在课堂上将技术技能与历史思维相结合。这个大纲与AI素养倡议相一致,包括欧盟委员会的《公民数字能力框架》(DigComp 2.2)、联合国教科文组织的《学生AI能力框架》和欧盟委员会和经济合作与发展组织(OECD)的《AI素养框架》预览。
Aeneas团队继续与多样化的主题专家合作,使用Aeneas帮助揭示我们古代的过去——更多内容即将推出。
**致谢**
研究由Yannis Assael和Thea Sommerschield共同领导。
贡献者包括:Alison Cooley、Brendan Shillingford、John Pavlopoulos、Priyanka Suresh、Bailey Herms、Jonathan Prag、Alex Mullen和Shakir Mohamed。Aeneas网络界面由Justin Grayston、Benjamin Maynard和Nicholas Dietrich开发,由Google Cloud提供支持。
教学大纲由Sint-Lievenscollege、根特、比利时的Robbe Wulgaert开发。
相似文章
视听行业正在转型吗?我们可以用它来创新历史教学方式吗?
一部关于古罗马的纪录片利用AI生成历史上准确的文物和场景图像,引发了对AI在历史教育中的作用以及视听行业转型的讨论。
@GoogleDeepMind:计算发现 一个基于AlphaEvolve和实证研究辅助的自主代理原型,用于开发和评分…
Google DeepMind推出一个计算发现原型,它利用AlphaEvolve和实证研究辅助并行开发和评分数千种代码变体,从而能够更快地测试流行病学建模方法。
Claude Mythos、Deepseek v4、HappyHorse、Meta 新 AI、实时视频游戏:AI 新闻
Anthropic 公布被雪藏的 Claude Mythos 模型,可自主挖掘数千个 0-day;ZAI 开源 1.5 TB GLM-5.1,登顶开放权重基准;阿里巴巴未发布的 HappyHorse 视频模型冲上公开榜第一;Deepseek 放出“专家模式”v4 预览。
AlphaGenome:用于更好地理解基因组的人工智能
DeepMind 推出 AlphaGenome,这是一个能够预测 DNA 序列变异如何影响基因调控和生物过程的 AI 模型,可应用于多种细胞类型和组织。该模型可处理多达 100 万个碱基对,通过 API 向非商业研究提供,完整论文已在《自然》杂志上发表。
AI 新闻:Anthropic 泄露揭示 AI 未来
泄露的 Claude Code 仓库曝光 Anthropic 的自主“恶魔模式”智能体与三层记忆系统,同时 OpenAI 完成创纪录的 1220 亿美元融资,微软发布 MAI-Transcribe-1。