文件名称:论文研究-基于MapReduce的海量数据挖掘技术研究.pdf
文件大小:703KB
文件格式:PDF
更新时间:2022-10-02 15:49:13
论文研究
MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。