文件名称:基于相对熵的文档聚类组合加权算法
文件大小:1.04MB
文件格式:PDF
更新时间:2024-04-26 23:58:09
Document clustering; combination weighting; relative
提出了一种基于相对熵的文档文档聚类加权算法。 组合加权被广泛应用于多属性决策(MADM)问题中。 但是,存在两个难题来阻碍组合加权在文档聚类中的应用。 首先,组合加权是基于主观加权和客观加权的综合。 但是,文档中有太多属性,以致于依靠专家手动注释的主观权重是不可行的。 其次,文档数据对象可能包含数百个甚至数千个功能。 计算组合权重是非常耗时的任务。 为了解决这些问题,我们建议通过不区分主观权重和客观权重来简化组合权重。 同时,我们选择相对熵方法来减少运行时间。 在我们的算法中,我们获得了具有14种组合形式的组合权重集。 对真实文档数据的实验表明,无论是在AC / PR / RE度量还是在互信息(MI)度量上,所提出的CWRE-sIB算法均优于原始的顺序信息瓶颈(sIB)算法以及一系列加权算法, sIB算法,是通过将单个加权方案应用于原始sIB算法而构建的。