【文件属性】:
文件名称:阿里云javasdk源码-xxhadoop:使用Hadoop/Spark/Storm/ElasticSearch/MachineLearnin
文件大小:16.75MB
文件格式:ZIP
更新时间:2021-06-06 01:00:29
系统开源
阿里云java
sdk源码
xxhadoop
Data
Analysis
Using
Hadoop/Spark/Storm/ES/MachineLearning
etc.
This
is
My
Learning
Notes/Code/Demo.
Don't
fork,
Just
star
!
几个概念
BI:
包括ETL(数据的抽取、转换、加载),数据仓库(Data
Warehouse),OLAP(联机分析处理),数据挖掘(Data
Mining)等技术。
Data
Mining:在大量数据中自动搜索隐藏于其中的有着特殊关系性(属于Association
rule
learning)的信息的过程。相比商务智能,数据挖掘是一种更加学术的说法,强调技术和方法。
OLAP:是一个建立数据系统的方法,其核心思想即建立多维度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据实现可以钻取(Drill-down/up)、切片(Slice)、切块(Dice)等灵活、系统和直观的数据展现。
数据处理开源技术分类汇总
计算引擎
Hadoop:
Hadoop实现了一个分