hadoop 大数据集 数据并行挖掘

时间:2018-01-14 03:11:15
【文件属性】:
文件名称:hadoop 大数据集 数据并行挖掘
文件大小:246KB
文件格式:CAJ
更新时间:2018-01-14 03:11:15
大数据 基于 [:<==5 分布式计算平台,给出一种适用于大数据集的并行挖掘算法%该算法对非结构化的原始大数据集以 及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的 [:<==5 计算节点进 行处理,以减少各个计算节点的存储数据,进而减少各个计算节点执行交集操作的次数,提高并行挖掘效率%实验结果表 明,给出的并行挖掘算法解决了大数据集挖掘过程中产生的大量数据通信#中间数据以及执行大量交集操作的问题,算法 高效#可扩展%

网友评论