big-data:大数据分析与管理

时间:2021-07-07 18:24:15
【文件属性】:
文件名称:big-data:大数据分析与管理
文件大小:17.05MB
文件格式:ZIP
更新时间:2021-07-07 18:24:15
Java 大数据分析与管理 使用 Hadoop 框架实现多个 map reduce 设计模式,以从 IMDB 电影数据中获取一些统计信息。 课程作业 CS 6301 作业 数据集 文件夹中包含许可证和自述文件 ratings.dat UserID::MovieID::Rating::Timestamp users.dat UserID::Gender::Age::Occupation::Zip-code 电影.dat 电影ID::标题::流派 地图缩减设计 给定一个输入邮政编码,找到属于该邮政编码的所有用户 ID。 您必须在命令行中获取输入的邮政编码。 按评分降序查找平均评分最高的 10 部电影。 查找所有对至少 n 部电影进行过评分的用户 ID。 给定一些 csv 格式的电影标题 - 找到电影的所有类型。 根据用户的平均年龄,按照平均年龄从高到低的顺序,查找属于该邮政编码的前 10 个
【文件预览】:
big-data-master
----Pig()
--------Q3.pig(452B)
--------Q2.pig(389B)
--------Q4.pig(235B)
--------FORMAT_GENRE_PIG.java(1021B)
--------Q1.pig(1KB)
--------FORMAT_GENRE_PIG.jar(3KB)
----Dataset()
--------Pig()
--------ratings.dat(23.45MB)
--------Hive()
--------movies.dat(167KB)
--------users.dat(131KB)
--------README(5KB)
----README.md(6KB)
----Joins()
--------Q2.java(8KB)
--------Q1.java(3KB)
--------Q3.java(7KB)
----Hive()
--------Q1.hive(741B)
--------Q4.hive(1KB)
--------Q3.hive(555B)
--------FORMAT_GENRE_HIVE.jar(1KB)
--------Q5.hive(377B)
--------Q2.hive(1008B)
--------FORMAT_GENRE_HIVE.java(773B)
----Cassandra()
--------Q2.txt(510B)
--------Q1.txt(1KB)
--------Q3.txt(123KB)
----.gitattributes(483B)
----Design()
--------Q2.java(6KB)
--------Q1.java(3KB)
--------Q4.java(3KB)
--------Q5.java(5KB)
--------Q3.java(2KB)
----Spark()
--------Q1.scala(671B)
--------Q3_1.txt(272B)
--------Q3_2.txt(1KB)
--------Q2.scala(883B)
--------indicator-matrix()

网友评论