文件名称:csc8101-Hadoop-assignment:CSC8101“大数据分析”Hadoop部分学习成果评估作业
文件大小:18KB
文件格式:ZIP
更新时间:2024-07-18 02:38:15
Java
##MapReduce 编程:使用 hadoop 计算*文章的内部 PageRank。 本课程将向您介绍编程和数据操作的MapReduce模型。 它将提供分析真实数据源的有限实践经验:。 ###数据: 出于本次作业的目的,您已获得一组荷兰语*文章,这些文章存储为单个.xml文档。 文档格式如下: < mediawiki> < page>... page> < page> < title >Foo</ title > < text>Lorem ipsum dolor sit amet... text> page> < page> < title >Bar</ title > < text>Lorem ipsum dolor sit [[Foo|
【文件预览】:
csc8101-Hadoop-assignment-master
----src()
--------main()
----example-input.xml(10KB)
----README.md(9KB)
----pom.xml(2KB)
----.gitignore(563B)