文件名称:Hadoop集群高可用与性能优化
文件大小:7.79MB
文件格式:PDF
更新时间:2022-05-12 11:21:42
Hadoop 高可用性 性能优化 大数据
HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供搞吞吐量的数据访问,非常适合大规模数据集上的应用。Hadoop MapReduce是一个使用简易的编程模型,基于它写出来的应用程序能够运行在由成千上万个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。本文对Hadoop平台下的HDFS和MapReduce分别进行了深入研究和实践。