文件名称:codeChallenge:洞察数据工程代码挑战
文件大小:513KB
文件格式:ZIP
更新时间:2024-07-07 09:50:37
Java
代码挑战 字数统计一个名为wordCount.java的 Java 程序对包含在名为 /wc_input 的目录中的文本文件中的所有单词进行计数。 然后将结果输出到目录/wc_output 中名为wc_result.txt 的文件。 运行中值一个名为RunMedian.java的 Java 程序跟踪数字流的中值,更新每个新数字的中值。 /wc_input 中的文件按字母顺序处理。 结果将写入名为 med_result.txt 的文本文件,该文件位于 /wc_output 目录中。 这些程序过滤掉了不是 .txt 的文件。 虽然我们假设 /wc_input 中的所有文件都是文本文件。 然而,在实施过程中,.DS_Store 文件,一个由 MAC OS X 创建的隐藏文件,也可能包含在文字处理中。 要执行代码,请运行 shell 脚本run.sh 。
【文件预览】:
codeChallenge-master
----wc_output()
--------med_result.txt(180B)
--------wc_result.txt(3KB)
----src()
--------RunMedian.java(3KB)
--------wordCount.java(2KB)
----run.sh(176B)
----README.md(863B)
----wc_input()
--------Brown_dev.txt(1.32MB)
--------secondFile.txt(1KB)
--------firstFile.txt(3KB)