文件名称:XML_MR_Reader:使用 XML InputFormat Map Reduce
文件大小:5.98MB
文件格式:ZIP
更新时间:2024-07-16 02:39:25
Java
XML_MR_Reader 使用 XML InputFormat 映射 Reduce。 这是一段代码,用于清理 Wiki XML 数据集并将其转换为带分隔符的文本。 从*档案中提取电影数据进行分析。 提供了 Sample.xml。 如果您的 XML 结构发生变化,请查看 WikiMR 驱动程序以进行更改。 玩得开心!!!
【文件预览】:
XML_MR_Reader-master
----src()
--------com()
----dependent_jars()
--------slf4j-api-1.7.5.jar(25KB)
--------jdom-2.0.5.jar(293KB)
--------commons-httpclient-3.1.jar(298KB)
--------hadoop-common-2.3.0-cdh5.0.1.jar(2.68MB)
--------commons-cli-1.2.jar(40KB)
--------com.google.common_1.0.0.201004262004.jar(765KB)
--------commons-logging-1.1.3.jar(61KB)
--------commons-io-2.4.jar(181KB)
--------commons-collections-3.2.1.jar(562KB)
--------slf4j-log4j12-1.7.5.jar(9KB)
--------hadoop-core-2.3.0-mr1-cdh5.0.1.jar(1.68MB)
----README.md(311B)
----sample.xml(188B)