《关于大数据的一些基本常识整理》

时间:2021-10-25 17:40:05

1.Hadoop生态


Hadoop生态圈介绍

Hadoop百度百科

MapReduce百度百科

Yarn百度百科

Hive百度百科

HBase百度百科

Hadoop可视化分析利器之Hue

Flume百度百科

Sqoop百度百科

Spark百度百科

Storm百度百科

Impala百度百科

Cloudera 百度百科

Oozie百度百科


2.大数据基本常识

关于大数据最常见的10个问题

作为大数据工程师,你必须熟练运用的性能优化技术

Hadoop中namenode和datanode是否可以共存问题

Hadoop源码解读-Job初始化过程

Hadoop中mapred包和mapreduce包的区别

hadoop、hbase、hive版本对应关系

Hadoop常用命令汇总

Hadoop的启动与停止

hadoop完全分布式和伪分布式有什么不同

Apache,CDH和Cloudera三者有什么区别



3.流式大数据处理框架


流式大数据处理的三种框架:Storm,Spark和Samza


4.大数据计算服务


大数据计算服务MaxCompute


5.大数据分析


【多维分析系列】拥抱大数据多维分析查询

全网最详细Apache Kylin1.5安装(单节点)和测试案例


6.大数据时代下的运维


大数据时代的IT运维进化分析

IT管理领域的大数据运维、数据处理和数据挖掘应该怎么做?


7.大数据实战演练

大数据下的技术运营(二)——数据采集系统设计与实现

简单搭建 Apache Kafka 分布式消息系统

漫谈ELK在大数据运维中的应用

携程大数据实践:高并发应用架构及推荐系统案例