文件名称:自然历史收藏的语义注释-研究论文
文件大小:4.92MB
文件格式:PDF
更新时间:2024-06-30 04:27:30
Linked Data Biodiversity
世界各地的自然历史博物馆都收藏了大量历史生物多样性探险活动。 它们有可能成为文化历史和生物多样性研究的丰富数据来源。 然而,它们仅作为部分编目标本库和非结构化、非标准化、手写文本和图纸的图像存在。 尽管许多档案馆藏已被数字化,但公开其内容具有挑战性。 它们指的是历史地名和过时的分类学分类,并以多种语言编写。 转录手写文本的努力可以使内容易于访问,但从语义上描述和链接内容将进一步促进研究。 我们提出了一种语义模型,用于构建自然历史档案馆藏中的命名实体。 此外,我们提出了一种对这些集合进行语义注释的方法,同时记录它们的出处。 这种方法作为自适应学习方法的第一步,用于从自然历史档案馆藏中半自动提取命名实体。 语义模型和注释方法的适用性通过荷兰印度群岛自然历史委员会在 1820 年至 1850 年间收集的 8,000 份实地书籍页面的图像扫描得到证明,并与自然领域的领域专家一起进行评估和文化历史。