文件名称:word源码java-hadoop-v1:hadoop入门
文件大小:34KB
文件格式:ZIP
更新时间:2024-06-25 17:05:04
系统开源
word源码java hadoop生态圈 spark生态圈 大数据概述 初识hadoop 分布式文件系统HDFS 分布式资源调度YARN 分布式计算框架MapReduce Hadoop项目实战 数据仓库Hive Hive项目实战 Hadoop分布式集群搭建 大数据概述 商品推荐 预言家 大数据4V特征 1、数据量Volume 2、多样性,复杂性Variety 3、基于高度分析的新价值Value 4、速度Velocity 大数据带来的技术变革 1、技术驱动:数据量大 存储:文件存储 ==> 分布式存储 计算:单机 ==> 分布式计算 网络:万兆 DB :RDBMS ==> NoSQL(HBase/Redis。。。) 2、商业驱动 大数据现存的模式 手握大数据,没有大数据思维 没有大数据、有大数据思维 既有大数据、又有大数据思维 大数据技术概述 单机:cpu memory disk 分布式并行计算/处理 数据采集 flume(日志采集局和传输系统) sqoop(关系型数据库<->hdfs) 数据存储 hadoop(hdfs) 数据处理/分析/挖掘 hadoop、spark、flink、hi
【文件预览】:
hadoop-v1-master
----pom.xml(1KB)
----hadoop-v1.iml(80B)
----src()
--------test()
--------main()
----file()
--------access()
--------wordCount()
----.gitignore(303B)
----README.md(25KB)