spark-base:读取文件文本并将其从HDFS写入拼花文件

时间:2024-04-09 02:19:19
【文件属性】:

文件名称:spark-base:读取文件文本并将其从HDFS写入拼花文件

文件大小:49.13MB

文件格式:ZIP

更新时间:2024-04-09 02:19:19

Java

火花基 读取文件文本并将其从HDFS写入拼花文件 使用路径/ usr / trannguyenhan将sample_text文件夹中的5个文件.dat推送到HDFS(您可以修改路径,但也必须在代码中修改路径) hdfs dfs -mkdir /usr hdfs dfs -mkdir /usr/trannguyenhan hdfs dfs -copyFromLocal 稍后,转到文件夹项目并打开终端并运行: mvn clean package 是构建文件jar,文件jar诞生在目标文件夹中。使用spark-submit运行jar文件: spark-submit --class main.Main --master local[2] target/-V1.jar 一个文件夹的pageviewlog在HDFS中诞生。使用cho


【文件预览】:
spark-base-master
----bin()
--------model()
--------fileservices()
----pom.xml(2KB)
----target()
--------SparkTutorials-V1.jar(10KB)
--------maven-status()
--------classes()
--------maven-archiver()
----.settings()
--------org.eclipse.m2e.core.prefs(86B)
--------org.eclipse.jdt.core.prefs(417B)
----src()
--------model()
--------fileservices()
--------main()
----.project(539B)
----.classpath(760B)
----README.md(668B)
----sample_text()
--------pt-v-1533870249648.dat(29.48MB)
--------pt-v-1533870189822.dat(29.48MB)
--------.ouput.dat.crc(472KB)
--------model log.txt(788B)
--------pt-v-1533870013310.dat(29.48MB)
--------pt-v-1533869954405.dat(29.48MB)
--------pt-v-1533870072206.dat(29.48MB)
--------.output.dat.crc(1.15MB)

网友评论