首页 >> 生活 >

研究人员开发了古代楔形文字板的自动文本识别

2023-11-21 16:44:01 来源: 用户: 

由马丁·路德大学哈勒维滕贝格(MLU)、约翰内斯·古腾堡美因茨大学和美因茨应用科学大学的团队开发的一种新的人工智能(AI)应用程序现在能够破译楔形文字板上难以阅读的文本。

AI系统使用平板电脑的3D模型而不是照片,提供比以前的方法更可靠的结果。这使得搜索多个平板电脑的内容并相互比较成为可能。它还为全新的研究问题铺平了道路。研究结果发表在《欧洲图形学协会》杂志上。

在他们的新方法中,研究人员使用了近2,000块楔形文字板的3D模型,其中约50块来自MLU收藏。据估计,全球仍存在约100万台此类平板电脑。其中许多已有5000多年的历史,是人类现存最古老的书面记录之一。

它们涵盖了极其广泛的主题。“一切都可以在上面找到:从购物清单到法庭判决。这些石板让我们得以一睹人类几千年前的过去。然而,它们已经风化得很厉害,因此即使是训练有素的眼睛也很难辨认,”助理休伯特·马拉说MLU教授。

这是因为楔形文字板是未烧制的粘土块,上面已压有文字。更复杂的是,当时的书写系统非常复杂并且包含多种语言。因此,正确识别符号不仅需要最佳的照明条件,还需要大量的背景知识。“到目前为止,同时访问许多楔形文字板的内容一直很困难-你需要确切地知道你在寻找什么以及在哪里,”玛拉补充道。

他的实验室提出了开发基于3D模型的人工智能系统的想法。新系统比以前的方法更好地破译字符。原则上,人工智能系统的工作原理与OCR软件(光学字符识别)相同,后者将书写和文本的图像转换为机器可读的文本。

这有很多优点。一旦转换成计算机文本,文字就可以更容易地阅读或搜索。“OCR通常适用于照片或扫描件。这对于纸上或羊皮纸上的墨水来说没有问题。然而,对于楔形文字板来说,事情就更困难了,因为光线和视角极大地影响了某些字符的识别效果,”MLU的ErnstStötzner解释道。他开发了新的人工智能系统,作为休伯特·马拉(HubertMara)指导下的硕士论文的一部分。

该团队使用三维扫描和附加数据来训练新的人工智能软件。其中大部分数据由美因茨应用科学大学提供,该大学正在监督一个大型粘土片3D模型项目。人工智能系统随后确实成功地可靠地识别了平板电脑上的符号。“我们惊讶地发现我们的系统甚至可以很好地处理照片,而照片实际上是较差的源材料,”斯托茨纳说。

哈勒和美因茨的研究人员的工作为迄今为止相对独特的材料提供了新的途径,并开辟了许多新的研究方向。到目前为止,它只是一个能够可靠地识别两种语言符号的原型。然而,已知总共存在十二种楔形文字。未来,该软件还可以帮助破译风化的铭文,例如墓地中的铭文,这些铭文就像楔形文字一样是三维的。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章