文件名称:基于主题模型的百科知识库实体对齐
文件大小:2.15MB
文件格式:PDF
更新时间:2024-05-20 06:45:57
实体对齐 潜在狄利克雷分配模型 置信传播算法
针对传统实体对齐方法无法体现潜在语义信息的问题,对其进行优化,使实体对齐效果更加显著。使用潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型对网络百科非结构化数据进行建模,采用改进的置信传播(belief propagation,BP)算法求解LDA模型中的隐藏参数,进而生成实体特征向量进行相似度计算,通过计算结果判断是否可以对齐。实验结果表明,通过与三种传统算法进行比较,所提算法在准确率、召回率和综合指标F值三个评价指标方面均有所提高。针对具有描述信息的网络百科实体,该算法可以有效提升实体对齐效果。