大数据学习脑图以及7个入门教程!

时间:2024-03-09 11:51:05

近些年,大数据的火热可谓是技术人都知道啊,很多人呢,也想学习大数据相关,所以,这里分享几个大数据脑图,希望可以让你清楚明白从哪里入门大数据,知道该学习以及掌握哪些知识点;

大数据相关脑图:

hadoop生态圈(转).png

大数据(转).jpg

HIVE学习路径(转).png

大数据工程师 - 学习路径 - 实验楼.png

PS.上图中的所有课程以及项目,皆可在实验楼在线学习;

当然,除了上面的脑图呢,这里还分享几个相关基础入门教程,旨在帮助你快速入门掌握大数据相关知识点;

实验楼hadoop课程列表:

Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架,该教程学习并实践Hadoop系统的不同模式的部署,以及基本的系统使用与管理。

课程涵盖了大数据领域常见的组件,如Hadoop,Mapreduce,HBase,Mahout,Pig,Hive,Sqoop等。首先从理论上进行介绍,然后让您在实验环境中一步步搭建,及相应的案例学习。学习完本课程您将对大数据有深入的了解,并能够很快的上手。

对于图处理,hadoop的mapreduce提供一层合并,这表明我们不得不像剥洋葱一样来处理图数据,Giraph 是 Google Pregel 的一种开源实现。本课程将基于hadoop平台实现Giraph 分布式系统中的图处理。

Hive 是一个基于 Hadoop 文件系统之上的数据仓库架构。它可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql 查询功能。还可以将 sql 语句转换为 MapReduce 任务运行。该教程就带你快速入门HIVE。

Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。本课程难度为简单,属于入门级别课程,适合本课程难度为一般,属于初级级别课程,适合具有hadoop基础的用户。

HBase是一个开源的非关系型分布式数据库(NoSQL),是Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务。该课程带你快速入门HBase。

本课程是 Hadoop 的一个非常基础的应用项目,利用实验楼提供的 Hadoop 环境,对一本武侠小说的文集进行简单的 WordCount 词频统计,从而得到该书中出现频次最高的人名。需要一定的 Hadoop 和 MapReduce 基础。本课程难度为简单,属于入门级别课程,适合对 Hadoop 刚刚入门的用户,甚至没有接触过 Hadoop 的用户也可以按照步骤一步步做出来。