文件名称:SCaSV:分析特定网站词频
文件大小:46.67MB
文件格式:ZIP
更新时间:2024-07-14 09:35:19
Java
SCaSV 分析特定网站词频 词云被其他人使用。
【文件预览】:
SCaSV-master
----bin()
--------Stemming.class(3KB)
--------MyCrawlerController.class(4KB)
--------WordCount.class(4KB)
--------MyCrawler.class(3KB)
--------WordCloud()
----SmartApp.iml(2KB)
----crawler4j-3.5-dependencies()
--------log4j-1.2.14.jar(359KB)
--------asm-3.1.jar(42KB)
--------tagsoup-1.2.1.jar(89KB)
--------metadata-extractor-2.4.0-beta-1.jar(89KB)
--------geronimo-stax-api_1.0_spec-1.0.1.jar(28KB)
--------commons-logging-1.1.1.jar(59KB)
--------httpclient-4.2.3.jar(423KB)
--------httpcore-4.2.2.jar(218KB)
--------commons-compress-1.3.jar(219KB)
--------tika-core-1.0.jar(417KB)
--------commons-codec-1.6.jar(227KB)
--------apache-mime4j-core-0.7.jar(93KB)
--------je-4.0.92.jar(2.03MB)
--------tika-parsers-1.0.jar(413KB)
--------apache-mime4j-dom-0.7.jar(293KB)
--------boilerpipe-1.1.0.jar(90KB)
----src()
--------Exp.java(2KB)
----crawler4j-3.5()
--------crawler4j-3.5.jar(98KB)
--------log4j.properties(259B)
----lib()
--------itext.jar(1.08MB)
--------log4j-1.2.14.jar(359KB)
--------pdf.jar(4KB)
--------core.jar(172KB)
--------asm-3.1.jar(42KB)
--------tagsoup-1.2.1.jar(89KB)
--------crawler4j-3.5.jar(98KB)
--------metadata-extractor-2.4.0-beta-1.jar(89KB)
--------geronimo-stax-api_1.0_spec-1.0.1.jar(28KB)
--------commons-logging-1.1.1.jar(59KB)
--------httpclient-4.2.3.jar(423KB)
--------httpcore-4.2.2.jar(218KB)
--------commons-compress-1.3.jar(219KB)
--------tika-core-1.0.jar(417KB)
--------jhannanum.jar(161KB)
--------org.snu.ids.ha.jar(7.37MB)
--------commons-codec-1.6.jar(227KB)
--------apache-mime4j-core-0.7.jar(93KB)
--------je-4.0.92.jar(2.03MB)
--------tika-parsers-1.0.jar(413KB)
--------apache-mime4j-dom-0.7.jar(293KB)
--------boilerpipe-1.1.0.jar(90KB)
--------jsoup-1.7.2.jar(287KB)
----README.md(247B)
----Data()
--------Word.csv(1.51MB)
--------Word.txt(912KB)
--------Stemming.txt(37.72MB)
--------Data.txt(71.21MB)
--------DataRank.txt(972B)