文件名称:mapreduce.zip
文件大小:12.01MB
文件格式:ZIP
更新时间:2022-08-23 08:38:06
ET
此代码是ETL项目中数据清洗的具体代码实现,实现了特定字段的数据抽取,以及把text文本转化为avro文件、转化为orc文件,为之后的导入hive表做准备
【文件预览】:
mapreduce
----.project(561B)
----src()
--------test()
--------main()
----target()
--------maven-status()
--------generated-sources()
--------classes()
--------mapreduce-1.0.jar(35KB)
--------mapreduce-1.0-hainiu.jar(32KB)
--------maven-archiver()
--------archive-tmp()
--------test-classes()
----.settings()
--------org.eclipse.m2e.core.prefs(90B)
--------org.eclipse.jdt.core.prefs(243B)
--------org.eclipse.core.resources.prefs(247B)
----pom.xml(3KB)
----.classpath(1KB)