BigDataProject:大数据学科的第一个项目

时间:2024-06-07 14:43:38
【文件属性】:

文件名称:BigDataProject:大数据学科的第一个项目

文件大小:208KB

文件格式:ZIP

更新时间:2024-06-07 14:43:38

Java

大数据项目 描述 这是BigData领域的第一个项目,旨在将现代分析技术与经典技术相结合(在哥伦比亚公司中仍广泛使用)。 基本上,该项目包括ETL过程,该过程由德克萨斯州发布的关于该州不同医院所发生的突发事件的一组免费数据,然后必须对数据进行所有处理,分析和可视化。无论是在描述性还是预测性分析方面,每天的磋商情况都是如此。 先决条件 Pentaho PDI MySQL 蜂巢 HDFS HBase的 火花 资料夹结构 . ├── mysql │ ├── mysql-inpatient.txt │ └── mysql-outpatient.txt ├── pdi │ ├── mix-by-year.ktr │ ├── inpatient-select-merge.ktr │ └── outpatient-merge-select.ktr


【文件预览】:
BigDataProject-master
----mysql()
--------mysql-outpatient.txt(433B)
--------mysql-inpatient.txt(553B)
----questions()
--------spark()
--------mysql()
--------hive()
----sqoop()
--------inpatients.java(38KB)
--------outpatients.java(29KB)
----README.md(18KB)
----Tableau()
--------Libro1.twb(559KB)
----pdi()
--------mix-by-year.ktr(655KB)
--------outpatient-merge-select.ktr(125KB)
--------inpatient-select-merge.ktr(205KB)

网友评论