可扩展的Bootstrap集群以处理海量数据

时间:2024-04-06 00:54:35
【文件属性】:

文件名称:可扩展的Bootstrap集群以处理海量数据

文件大小:1.32MB

文件格式:PDF

更新时间:2024-04-06 00:54:35

data mining; bag of little

引导程序提供了一种简单而强大的方法来提高聚类的准确性。 但是,对于当今日益庞大的数据集,基于引导程序的数量的计算可能会过分苛刻。 在本文中,我们引入小引导袋聚类(BLBC)这一新过程,该过程利用小引导袋聚类技术获得了一种强大的,计算效率高的海量数据聚类方法。 此外,BLBC适用于在经常用于处理大型数据集的现代并行和分布式计算体系结构上的实现。我们通过实证研究BLBC的性能特征,并通过对模拟数据和真实数据的实验与现有方法的性能进行比较。 结果表明,BLBC在保持良好统计正确性的同时,比基于Bootstrap的聚类具有明显更优越的计算性能。


网友评论