文件名称:mongodb-hadoop-workshop:MongoDB-Hadoop 研讨会练习
文件大小:1.59MB
文件格式:ZIP
更新时间:2024-08-01 11:57:30
Java
MongoDB-Hadoop 研讨会练习 MongoDB 作为操作数据库为应用程序提供支持,而 Hadoop 与强大的分析基础设施一样提供智能。 在本次研讨会中,我们将首先了解这些技术如何与适用于 Hadoop 的 MongoDB 连接器配合使用。 然后我们将介绍使用 MapReduce、Pig、Hive 和 Spark 读取/写入 MongoDB 数据。 最后,我们将讨论更广泛的数据生态系统和操作注意事项。 数据 在运行任何练习之前,将示例数据集加载到 MongoDB。 下载 下载档案并解压 最后,加载数据集: $ python dataset/movielens.py [/path/to/movies.dat] [/path/to/ratings.dat] 有关更多信息,请参阅 。 练习 有关构建和部署每个练习的步骤,请参阅各个 README。
【文件预览】:
mongodb-hadoop-workshop-master
----.gitignore(45B)
----dataset()
--------README.md(891B)
--------movielens.py(3KB)
--------mlsmall.tar.gz(1.62MB)
----LICENSE(11KB)
----hive()
--------pom.xml(2KB)
--------README.md(464B)
--------HiveExercise.q(1KB)
----README.md(1KB)
----pig()
--------PigExercise.pig(854B)
--------pom.xml(3KB)
--------README.md(350B)
----spark()
--------src()
--------pom.xml(3KB)
--------README.md(623B)
----mapreduce()
--------src()
--------pom.xml(3KB)
--------README.md(673B)