论文研究-基于PLSI的标签聚类研究.pdf

时间:2022-08-11 14:04:29
【文件属性】:

文件名称:论文研究-基于PLSI的标签聚类研究.pdf

文件大小:819KB

文件格式:PDF

更新时间:2022-08-11 14:04:29

大众分类,概率潜在语义索引,语义标签,回火期望最大化算法,凝聚式层次k中心点聚类

针对现有的大众分类中标签模糊导致影响用户搜索效率的问题, 使用概率潜在语义索引(probabilistic latent semantic indexing, PLSI)模型对标签进行潜在语义分析, 经回火期望最大化(tempered exception maximization, TEM)算法训练得到在潜在语义下的条件概率, 生成概率向量; 在此基础上, 提出凝聚式层次k中心点(hierarchical agglomerative K-mediods, HAK-mediods)聚类算法对概率向量进行聚类, 并进行了相关对比实验。实验结果表明, HAK-mediods算法的聚类效果要好于传统的聚类算法, 从而验证了该算法的可行性和有效性。


网友评论