DataAndVisualAnalytics:基于决策树、Hadoop、Apache Spark、Apache Pig、D3、SQL 的项目

时间:2024-07-23 14:26:29
【文件属性】:

文件名称:DataAndVisualAnalytics:基于决策树、Hadoop、Apache Spark、Apache Pig、D3、SQL 的项目

文件大小:13.61MB

文件格式:ZIP

更新时间:2024-07-23 14:26:29

Java

数据与视觉分析 家庭作业和项目 Hadoop - MapReduce 程序,用于计算图中每个节点的所有传入边的权重总和。 Spark/Scala - 与 Hadoop 相同的图形分析,但使用 Spark 和 Scala Pig_AWS - Pig 脚本使用 AWS 服务 S3 和 EMR 来分析大型数据集 - Google bigrams。


【文件预览】:
DataAndVisualAnalytics-master
----D3()
--------BarChartScatterPlotTableau()
--------ForceDirectedLayout()
----.gitattributes(378B)
----Visualize_Gephi()
--------graph_metrics.txt(308B)
--------graph_explanation.txt(915B)
--------graph.png(61KB)
----Hadoop()
--------src()
--------task1output1.tsv(612KB)
--------run1.sh(220B)
--------task1output2.tsv(11.11MB)
--------run2.sh(220B)
--------description.txt(717B)
--------pom.xml(2KB)
----D3_Warmup()
--------index.html(686B)
--------d3()
----SQLite()
--------Q3_Movies.csv(18KB)
--------Q3.out.txt(2KB)
--------Q3_actors.csv(73KB)
--------Q3.sql(2KB)
--------Q3_cast.csv(94KB)
----Query_ParseData()
--------JavaSource()
--------JavaSource.zip(1.18MB)
--------tracks.csv(6KB)
--------LastFm_903081902.jar(1.31MB)
--------README.txt(763B)
--------track_id_sim_track_id.csv(62KB)
----Spark_Scala()
--------src()
--------run1.sh(247B)
--------run2.sh(247B)
--------task2output1.tsv(612KB)
--------description.txt(950B)
--------pom.xml(3KB)
--------task2output2.tsv(11.11MB)
----README.md(351B)
----.gitignore(574B)
----PigScript_bigramAnalysis()
--------output-small.txt(302B)
--------description.txt(553B)
--------pig.txt(528B)
--------output-big.txt(289B)
----DecisionTreesAndWeka()
--------WekaExploreAndCompare()
--------DecisionTree()

网友评论