阿里云javasdk源码-xxhadoop:使用Hadoop/Spark/Storm/ElasticSearch/MachineLearnin

时间:2021-06-06 01:00:29
【文件属性】:
文件名称:阿里云javasdk源码-xxhadoop:使用Hadoop/Spark/Storm/ElasticSearch/MachineLearnin
文件大小:16.75MB
文件格式:ZIP
更新时间:2021-06-06 01:00:29
系统开源 阿里云java sdk源码 xxhadoop Data Analysis Using Hadoop/Spark/Storm/ES/MachineLearning etc. This is My Learning Notes/Code/Demo. Don't fork, Just star ! 几个概念 BI: 包括ETL(数据的抽取、转换、加载),数据仓库(Data Warehouse),OLAP(联机分析处理),数据挖掘(Data Mining)等技术。 Data Mining:在大量数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。相比商务智能,数据挖掘是一种更加学术的说法,强调技术和方法。 OLAP:是一个建立数据系统的方法,其核心思想即建立多维度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据实现可以钻取(Drill-down/up)、切片(Slice)、切块(Dice)等灵活、系统和直观的数据展现。 数据处理开源技术分类汇总 计算引擎 Hadoop: Hadoop实现了一个分

网友评论