文件名称:基于PLSI的标签聚类研究 (2013年)
文件大小:819KB
文件格式:PDF
更新时间:2024-06-07 08:44:24
工程技术 论文
针对现有的大众分类中标签模糊导致影响用户搜索效率的问题, 使用概率潜在语义索引(probabilistic latent semantic indexing, PLSI)模型对标签进行潜在语义分析, 经回火期望最大化(tempered exception maximization, TEM)算法训练得到在潜在语义下的条件概率, 生成概率向量; 在此基础上, 提出凝聚式层次k中心点(hierarchical agglomerative K-mediods, HAK-mediods)聚类算法对概率