Samudra-Manthan-开源

时间:2024-06-04 05:45:07
【文件属性】:

文件名称:Samudra-Manthan-开源

文件大小:5.2MB

文件格式:GZ

更新时间:2024-06-04 05:45:07

开源软件

Samudra Manthan使用C和MPI在大量数据中查找有趣的n-gram(术语)。 我们使用GigaWord语料库,通过TF * IDF度量找到前m个有趣的n-gram。


【文件预览】:
Samudra-Manthan
----bin()
--------readme.txt(58B)
----development()
--------m-through-n-popular_terms.c(12KB)
----include()
--------dictionary.h(133B)
--------worker.h(186B)
--------TFIDFScore.h(148B)
--------SuffixArrayAndLcp.h(383B)
--------SuffixArrayClasses.h(681B)
--------ngramstore1.h(187B)
--------manager.h(130B)
--------Stack.h(434B)
----source()
--------sorted_GigawordDictionary2.txt(14.57MB)
--------dictionary.c(4KB)
--------SuffixArrayClasses.c(16KB)
--------worker.c(4KB)
--------clean.sh(57B)
--------runit.sh(180B)
--------sorted_stopwords.txt(828B)
--------compile.sh(160B)
--------popular_terms.c(14KB)
--------myscript(231B)
--------Stack.c(4KB)
--------SuffixArrayAndLcp.c(9KB)
--------manager.c(5KB)
--------extract_corpus.sh(194B)
----deprecated()
--------include()
--------source()
----README(3KB)
----doc()
--------Final-Report.pdf(128KB)
--------CalakmulPresentation.ppt(552KB)
--------readme.txt(45B)
----samples()
--------readme.txt(37B)

网友评论