文件名称:搭建基于云计算的开源海量数据挖掘平台
文件大小:390KB
文件格式:PDF
更新时间:2015-05-14 17:27:40
通过分析亚马逊弹性 M apRe duce( EMR)平台构架, 针对信息情报机构内部数据处理的迫切需求, 提出通 过开源技术 Xen和 H adoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、 海量文本数 据处理案例和开源 EMR平台的优势分析。实施方案主要分为三部分: 搭建动态虚拟的云计算环境、 安装制作 H adoop虚拟服务器模板、 配置运行 C l oudera和 C l oudera Desktop。通过开源 EMR架构的应用, 可以有效解决服务 器蔓延问题, 提高网络计算资源的利用效率和分布式数据挖掘服务的快速布署能力及灵活性。