文件名称:基于密度的分布式聚类算法研究
文件大小:1.2MB
文件格式:PDF
更新时间:2013-11-03 09:39:21
数据挖掘;分布式聚类;特殊核心对象
:大量复杂异构数据分布于各个网络站点上,分布式聚类是海量数据处理的一个重要应用。该文针对基于密度的分布式聚类(DBDC) 算法提出一种改进算法,利用局部聚类获取更佳的代表对象,将代表对象集附带相关信息传送至主站点,用增强的基于密度的聚类算法进 行全局聚类,并更新子站点聚类。理论分析和实验结果表明,该算法在聚类质量和算法效率方面优于DBDC 算法。