聚类数据挖掘伪代码例子

时间:2014-11-12 18:35:53
【文件属性】:

文件名称:聚类数据挖掘伪代码例子

文件大小:598KB

文件格式:PPT

更新时间:2014-11-12 18:35:53

聚类 数据挖掘 伪代码 例子

DIANA算法例子 第1步,找到具有最大直径的簇,对簇中的每个点计算平均相异度(假定采用是欧式距离)。 1的平均距离:(1+1+1.414+3.6+4.24+4.47+5)/7=2.96 类似地,2的平均距离为2.526;3的平均距离为2.68;4的平均距离为2.18;5的平均距离为2.18;6的平均距离为2.68;7的平均距离为2.526;8的平均距离为2.96。 挑出平均相异度最大的点1放到splinter group中,剩余点在old party中。 第2步,在old party里找出到最近的splinter group中的点的距离不大于到old party中最近的点的距离的点,将该点放入splinter group中,该点是2。 第3步,重复第2步的工作,splinter group中放入点3。 第4步,重复第2步的工作,splinter group中放入点4。 第5步,没有在old party中的点放入了splinter group中且达到终止条件(k-2),程序终止。如果没有到终止条件,因该从分裂好的簇中选一个直径最大的簇继续分裂。


网友评论

  • 额,我只能说,还行吧,虽然下好后发现没必要了....