文件名称:知识驱动的命名实体分类和链接的联合后验修订-研究论文
文件大小:1.71MB
文件格式:PDF
更新时间:2024-06-09 11:06:39
论文研究
在本文中,我们解决了从自然语言文本中提取优质实体知识的问题,这是从非结构化内容自动构建知识图的重要任务。 更详细地讲,我们研究由本体背景知识驱动的联合后验修订对自然语言处理(NLP)实体分析(例如命名实体识别和分类(NERC)和实体链接(EL))产生的注释的好处。 修订是通过称为JPARK的概率模型执行的,该模型给出了由NERC和EL工具在同一文本实体提及中独立标识的候选注释,并根据候选注释与的一致性重新考虑了工具执行的最佳注释选择。本体知识。 可以明确指示模型处理实体可能为NIL(即在目标链接知识库中缺少相应的参照对象)的信息,并利用该模型预测最佳NERC和EL注释组合。 我们对JPARK进行了全方位的全面评估,比较了在使用和不使用NIL信息的情况下JPARK的性能,以及使用三种不同的背景知识资源(YAGO,DBpedia和Wikidata)来构建模型。 该评估使用不同的工具(流行的斯坦福大学NER和DBpedia Spotlight以及最新的Flair NER和端对端神经EL)与三个参考数据集(AIDA,MEANTIME和TAC-KBP)进行了实证研究模型提高给定工具的注释质量的能力,从而提高其在设计任务上的性能。