文件名称:基于用户兴趣域的混合数据聚类标签算法 (2013年)
文件大小:1.09MB
文件格式:PDF
更新时间:2024-06-06 03:45:08
自然科学 论文
数据聚类标签技术是在小规模样本上进行聚类,然后利用聚类结果对其余样本标注类别的方法是提高大规模数据聚类效率的一种有效途径。混合数据是现实应用中最广泛的数据类型,文章将用户兴趣数据作为小规模数据,利用K-prototypes算法对其聚类,在此基础上构建用户兴趣域。利用拟标签数据的各属性值与用户兴趣域分量的关系定义了数据关于用户兴趣域隶属度。基于用户兴趣域和“数据-用户兴趣域”隶属度的概念,提出了一种基于用户兴趣混合数据聚类标签算法UIMCL(User'sInterestMixedDataClustering