hadoop备记

时间:2023-01-29 18:24:36

Hadoop 的优势

Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分 布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发执行处理海量数据的应用程序。它主要有下面几个长处:

1.高可靠性。Hadoop 按位存储和处理数据的能力值得人们信赖。

2.高扩展性。Hadoop 是在可用的计算机集簇间分配数据完毕计算任务的, 这些集簇能够方便地扩展到数以千计的节点中。

3.高效性。Hadoop 可以在节点之间动态地移动数据, 以保证各个节点的动态平衡, 因此其处理速度很快。

4.高容错性。Hadoop 可以自己主动保存数据的多份副本, 而且可以自己主动将失败的任务又一次分配。

如今的话Hadoop已经包括非常多项目。只是核心内容是MapReduce和Hadoop分布式文件系统。这里spark的话实时性性能方面比hadoop高非常多。这里我不多说什么。(http://www.zdnet.com/faster-more-capable-what-apache-spark-brings-to-hadoop-7000026149/能够看看spark与hadoop比較)

与Hadoop相关的Common,Avro,Chukwa,Hive,HBase等项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。