论文研究-基于网格密度和引力的不确定数据流聚类算法.pdf

时间:2022-08-11 12:53:28
【文件属性】:

文件名称:论文研究-基于网格密度和引力的不确定数据流聚类算法.pdf

文件大小:643KB

文件格式:PDF

更新时间:2022-08-11 12:53:28

不确定数据流,网格特征向量,网格密度,网格引力,零星网格

为改进EMicro算法存在的不足提出了GDF-CUStreams算法。该算法采用网格特征向量存储数据的分布特征,通过更新网格特征向量合并成簇对不确定数据流聚类,对新数据点的到来采用增量聚类。通过网格密度和网格质心之间的距离判定网格是否是零星网格,利用网格引力对簇边界进行优化,检测和删除零星网格,使簇边缘更加平滑,提高聚类精度。其中网格密度和网格质心都采用增量更新。实验结果表明,与EMicro算法相比,GDF-CUStreams效率更高且效果良好。


网友评论