文件名称:HadoopWithPython:通过Pythn玩Hadoop
文件大小:519KB
文件格式:ZIP
更新时间:2024-04-28 12:15:34
使用Python的Hadoop 带有Python的Hadoop存储库,包括示例源代码。 这个项目从开始 在单节点群集上运行Hadoop 从
【文件预览】:
HadoopWithPython-master
----pig()
--------udfs()
--------user_id.pig(108B)
--------recent_movies.pig(630B)
--------simple_udf.pig(153B)
--------playing_with_words.pig(821B)
--------wordcount.pig(528B)
----python()
--------MapReduce()
--------HDFS()
--------Luigi()
--------Spark()
----resources()
--------students(68B)
--------input.txt(61B)
--------movies(231KB)
--------salaries.csv(1.69MB)
----LICENSE(1KB)
----README.md(332B)