使用概念图的专利文献摘要-研究论文

时间:2024-06-30 07:19:19
【文件属性】:

文件名称:使用概念图的专利文献摘要-研究论文

文件大小:274KB

文件格式:PDF

更新时间:2024-06-30 07:19:19

Concept Mining Document

在本文中,提出了一种从文件中挖掘概念并使用这些概念生成专利文件权利要求部分的客观摘要的方法。 在这项工作中使用 Sowa (Sowa 1984) 提出的概念图 (CG) 形式来表示概念及其关系。 从文本文档中自动识别概念和概念关系是一项具有挑战性的任务。 在这项工作中,重点是对专利文件的分析,主要是文件的权利要求部分(Claim)。 这些文件的写作风格有多种复杂性,因为它们既是技术性的,也是法律性的。 据观察,开放领域中可用的通用深度解析器无法解析专利文件中的“索赔部分”句子。 深度解析器的失败促使我们开发使用其他资源提取 CG 的方法。 因此,在目前的工作中,使用浅层解析、NER 和机器学习技术从专利文件的权利要求部分中的句子中提取概念和概念关系。 因此,本文讨论了 i) CG 的生成、语义网络以及 ii) 专利权利要求部分的抽象摘要的生成。 目的是生成占整个索赔部分 30% 的摘要。 在这里,我们使用受限玻尔兹曼机 (RBM),这是一种自动提取 CG 的深度学习技术。 我们已经使用来自电子领域的 5000 份专利文件的语料库测试了我们的方法。 获得的结果令人鼓舞,可与最先进的系统相媲美。


网友评论