KNN分类算法的MapReduce并行化实现 (2013年)

时间:2024-06-09 17:27:31
【文件属性】:

文件名称:KNN分类算法的MapReduce并行化实现 (2013年)

文件大小:476KB

文件格式:PDF

更新时间:2024-06-09 17:27:31

工程技术 论文

为了提高k-nearest neighbor algorith m(KNN)算法处理大数据集的能力,本文利用Ma pReduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现。通过设计Ma p、Co mbine和Reduce 3个函数,实现了KNN算法的并行化。Ma p函数完成每个测试样本与训练样本之间的相似度计算,Co mbine函数作为一个本地的Reduce操作,用以减少中间计算量及通信开销,Reduce函数则根据上述函数得到的中间结果计算出k近邻并作出分


网友评论