词频统计+倒排索引+数据去重+TopN

时间:2022-01-24 11:22:40
【文件属性】:

文件名称:词频统计+倒排索引+数据去重+TopN

文件大小:7KB

文件格式:ZIP

更新时间:2022-01-24 11:22:40

mapreduce 词频统计 倒排索引 数据去重 TopN

词频统计+倒排索引+数据去重+TopN


【文件预览】:
topND
----input()
--------num.txt(52B)
----output()
--------._SUCCESS.crc(8B)
--------_SUCCESS(0B)
--------.part-r-00000.crc(12B)
--------part-r-00000(15B)
data
----b.txt(33B)
----a.txt(30B)
----.a.txt.bak.crc(12B)
----a.txt.bak(26B)
wordcount
----input()
--------b.txt(33B)
--------a.txt(47B)
----output()
--------._SUCCESS.crc(8B)
--------_SUCCESS(0B)
--------.part-r-00000.crc(12B)
--------part-r-00000(103B)
Dedup
----input()
--------file1.txt(108B)
--------file2.txt(60B)
----output()
--------._SUCCESS.crc(8B)
--------_SUCCESS(0B)
--------.part-r-00000.crc(12B)
--------part-r-00000(110B)
InvertedIndex
----input()
--------file1.txt(19B)
--------file3.txt(29B)
--------file2.txt(28B)
----output4()
--------._SUCCESS.crc(8B)
--------_SUCCESS(0B)
--------.part-r-00000.crc(12B)
--------part-r-00000(165B)

网友评论