2022
11/02
相关创新主体

创新背景

古代世界的大量证据,文本和物品的出土数量都在不断增长,并且越来越超出个别历史学家掌握的知识范围。在个人能力有限的情况下,人工智能为古代历史研究中的数据应用提供了新的方式,有助于人们更容易理解历史。

 

创新过程

牛津大学古典学院的研究人员与威尼斯大学人文系、雅典经济与商业大学信息学系以及谷歌的DeepMind合作,应用先进的机器学习研究古希腊文本,成功使用人工智能“Ithaca ”重新确定公元前5世纪雅典一系列重要法令的日期,相关研究成果《使用深度神经网络恢复和归因古代文本》发表在《自然》上。  

深度学习模型的文本处理能力

Ithaca可有意义地处理长期上下文信息并产生可解释的输出,以增强人机合作的潜力。几个世纪以来,古代文本部分单词可能会丢失。Ithaca将输入文本作为字符和单词表示形式进行处理,用特殊符号“[unk]”表示损坏、丢失或未知的单词。

恢复头预测三个缺失字符;地理归属负责人将铭文分为 84 个地区;按时间顺序排列的归属头可以追溯到公元前800 年至公元800 年之间。

它的躯干基于神经网络架构,使用注意力机制来权衡输入的不同部分(如字符、单词)对模型决策过程的影响,进而实现大规模处理。注意力机制通过将输入字符和单词表示与其顺序位置信息连接起来来告知输入文本每个部分的位置。躯干由堆叠的变压器块组成,最终输出被传递给三个不同的任务头,分别进行处理恢复、地理归属和时间归属。Ithaca的架构旨在提供可理解的输出,同时具有多种可视化方法,以增强模型预测假设的可解释性。

时间归属的高准确性

研究使用新模型揭示了希腊历史研究的争议问题,包括一系列重要的雅典法令的日期,这些法令被认为是在公元前446/445年之前制定的。历史学家最近提出的新证据表明,公元前420年代是更合适的时期。Ithaca法令的平均预测日期是公元前421年,与新证据近乎一致,展示了机器学习为历史研究争辩提供的可靠证据。

牛津大学古代历史教授表示,人工智能预测的时间与历史学家推测的时间虽然看起来差别很小,但这种日期变化对于理解古典雅典的政治历史具有重大意义。像Ithaca这样的模型能够释放人工智能和人文学科之间的合作潜力,改变历史研究中一些最重要时期的推测方式。

古希腊铭文已被损坏到难以辨认的地步,并远离其原始位置,使其起源日期充满不确定性。Ithaca以《荷马史诗》奥德赛中的希腊岛屿命名,可能有助于修复和归属新发现或不确定的铭文。该系统建立在Pythia的基础上并扩展了Pythia,在帕卡德人文学院最大的希腊铭文数字数据集上进行训练,只专注于文本恢复,以前所未有的规模使用深度学习进行地理和时间归属。

研究设计模型在设计时考虑了协作问题,支持历史学家与Ithaca辅助输入相结合的研究人员共同使用。虽然模型仅在修复损坏的文本时就达到了 62% 的准确率,但当历史学家使用它时,它们的性能从 25% 跃升至 72%。Ithaca还可以将铭文的准确率定为71%,并且与真实历史时间范围的出入不到30年。

团队将用其他古代语言训练的Ithaca版本进行其他古代文本探究,历史学家在当前架构中可使用数据集来研究其他古代书写系统,包括阿卡德语、德莫特语、希伯来语和玛雅语等。

 

创新关键点

在以往运用于古代历史文本研究的机器模型Pythia的基础上开发专注文本补充以及时间地理归属的机器学习模型Ithaca,对古代文本内容进行弥补并确定其时间归属。

 

创新价值

机器学习可以支持历史学家扩展和加深对古代历史的理解,有助于人们深入历史研究,探索消失损坏的历史记载,进一步挖掘人类文明的奥秘。

智能推荐

  • 考古学创新思维 | 基于人工智能开发考古测年新方法

    2022-08-30

    创新使用人工智能开发新的考古测年方法,基于DNA基因检测进行年代测定。

    涉及学科
    涉及领域
    研究方向
  • 考古学创新思维 | 使用x射线成像技术研究“Namacalathus”小型化石

    2022-11-05

    爱丁堡大学的学者们在纳米比亚的田野调查中,发现一种被称为Namacalathus的小型动物的化石遗骸。

    涉及学科
    涉及领域
    研究方向
  • 文物保护创新思维 | 多种技术结合提高历史书籍遗产研究和保护效率

    2022-08-14

    结合科学成像、数字化、3D显微镜以及数据集和材料分析等技术研究保护书面遗产。

    涉及学科
    涉及领域
    研究方向
  • 历史学创新思维 | 数字化技术促进历史研究纵深发展

    2022-08-16

    结合数字化技术、扫描成像技术再现历史文本的真实面目,呈现最本真的历史面貌。帮助历史研究深入发展且人们能够广泛了解历史事实。

    涉及学科
    涉及领域
    研究方向