文件名称:论文研究-基于聚类集成的人名消歧算法.pdf
文件大小:1004KB
文件格式:PDF
更新时间:2022-08-11 16:07:21
聚类集成,人名消歧,凝聚层次聚类,相似度矩阵
传统人名消歧算法中,每类特征仅反映人物实体的部分信息,且不同聚类算法各有优缺点。提出了一种基于聚类集成的人名消歧算法。从文本中提取上下文特征、实体特征、社会关系特征得到三个相似度矩阵,并对这三个相似度矩阵进行融合得到一个融合相似度矩阵,把这四个相似度矩阵作为输入,利用不同的聚类算法得到不同的划分,采用基于均方误差邻接矩阵聚类(squared error adjacency matrix clustering,SEAM)算法对这些划分进行集成,实现人名消歧。在CLP2010人名消歧训练语料上进行实验,结果表明,新算法有效地提高了人名消歧的准确性和鲁棒性。