文件名称:Hadoop:Hadoop编程
文件大小:105.18MB
文件格式:ZIP
更新时间:2024-05-18 23:28:25
hdfs mapreduce hadoop-custome-input-format hadoop-custom-datatypes hadoop-custom-partitioners
Hadoop 伙计们, 在这里,您将找到一些MapReduce示例程序来处理不同类型的文件,例如Text,PDF,CSV,Log,XML,Doc / Docx,XLS / XLSX等。 您还可以找到一个可以读取上面指定的任何文件类型的程序。 您还可以找到如何在Map Reduce中编写自定义数据类型和自定义分区程序。 #trendfinder文件夹:在Trendfinder文件夹中,您将发现如何使用多个Mappers和Reducers。 在这里,我们根据推文的出现来处理推特数据。 #logfiles文件夹:它包含一个程序,用于计算特定网站上每小时的观看次数。 #pdf文件夹:它包含如何在hadoop中编写我们自己的Custome FileInPutFormat,RecordReader类以处理PDF文件。 #Java到HDFS的连接在此软件包中,您将找到如何从Java连接到HD