文件名称:论文研究-基于优化密度的耦合空间LDA文本聚类算法研究.pdf
文件大小:890KB
文件格式:PDF
更新时间:2022-08-11 12:46:50
文本聚类,耦合空间模型,LDA主题模型,密度,阈值
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。