Hadoop生态系统介绍-hadoop大数据处理方案下载

【文件属性】：

文件名称：Hadoop生态系统介绍-hadoop大数据处理方案

文件大小：4.58MB

文件格式：PPT

更新时间：2024-05-16 04:04:25

Hadoop

Hadoop生态系统介绍 Spark：为了提高MapReduce的计算效率，spark可看做基于内存的MapReduce实现，Spark基础上包了一层SQL，产生了一个新的类似Hive的系统Shark，但目前Spark和Shark尚属于实验室产品。 Storm/S4：Hadoop在实时计算/流式计算领域（MapReduce假设输入数据是静态的，处理过程中不能被修改，而流式计算则假设数据源是流动的，数据会源源不断流入系统）一直比较落后；还好，Twitter开源的Storm和yahoo！开源的S4弥补了这一缺点，Storm在淘宝，mediaV等公司得到广泛的应用。 Cloudera Impala/Apache drill：Google Dremel的开源实现，也许是因为交互式计算需求太过强烈，发展迅猛，impala仅用了一年左右便推出1.0GA版本。这种系统适用于交互式处理场景，最后产生的数据量一定要少。Impala尽管发布了1.0版本，但在容错性、扩展性、支持自定义函数等方面，有很长的路要走。中国科学技术大学

立即下载

秒客网

Hadoop生态系统介绍-hadoop大数据处理方案

网友评论

相关文章