文件名称:论文研究-基于网格密度和引力的不确定数据流聚类算法.pdf
文件大小:643KB
文件格式:PDF
更新时间:2022-08-11 12:53:28
不确定数据流,网格特征向量,网格密度,网格引力,零星网格
为改进EMicro算法存在的不足提出了GDF-CUStreams算法。该算法采用网格特征向量存储数据的分布特征,通过更新网格特征向量合并成簇对不确定数据流聚类,对新数据点的到来采用增量聚类。通过网格密度和网格质心之间的距离判定网格是否是零星网格,利用网格引力对簇边界进行优化,检测和删除零星网格,使簇边缘更加平滑,提高聚类精度。其中网格密度和网格质心都采用增量更新。实验结果表明,与EMicro算法相比,GDF-CUStreams效率更高且效果良好。