文件名称:论文研究-基于上下文信息的中文命名实体消歧方法研究.pdf
文件大小:954KB
文件格式:PDF
更新时间:2022-08-11 15:39:36
命名实体,语义知识库,聚类,语义列表
在语义标注过程中,为了消除文本中给定的命名实体与知识库中实体映射过程中出现的歧义问题,提出了一种基于上下文信息相似度值排序的命名实体消歧方法。消歧方法包括实体表示预处理、候选实体列表构建和相似度值排序算法三部分。针对命名实体指称多样性问题,使用实体表示预处理方法抽取标准实体;然后利用中文在线百科构建语义知识库,得到标准实体的语义列表;同时提出利用相似度值排序方法解决标准实体与语义列表映射的指称歧义性问题,对于在知识库中未找到语义的实体采用HAC聚类算法进行消歧处理。实验结果表明,该的方法能够有效地把中文网页真实数据集中文本的实体映射到知识库中对应无歧义的实体上。