文件名称:论文研究-基于投影寻踪和MapReduce的并行案例推理模型.pdf
文件大小:878KB
文件格式:PDF
更新时间:2022-08-11 16:43:59
案例推理,投影寻踪,降维裁剪,MapReduce模型,并行推理
在大规模、高维度的数据环境下,传统的案例推理具有计算复杂度高、实时性差等缺点。为在大数据环境下进行案例推理,提出了一种基于投影寻踪和MapReduce的并行推理模型dpCBR。在数据预处理阶段,计算源案例到基准向量的一维投影距离并缓存,降低计算复杂度并减少重复计算开销;在案例检索阶段,先根据投影距离裁剪案例库,再进行相似度匹配,减少不必要的案例匹配开销。应用MapReduce进行分布式并行处理,使dpCBR具备对大规模案例库的推理能力。实验结果表明,dpCBR模型可以明显提高大数据环境下案例推理的效率。