文件名称:基于统计的自动文摘(中文)
文件大小:1.26MB
文件格式:RAR
更新时间:2017-04-30 04:45:20
自动文摘
IK中文分词,将句子重要程度化为所含词的重要程度来考虑,主要考虑词语的词频、文中位置、句中位置三方面的权重。 (修改版,非原创)
【文件预览】:
Summarization
----.project(389B)
----output()
--------3.txt(414B)
--------4.txt(561B)
--------5.txt(533B)
--------2.txt(242B)
--------1.txt(469B)
----src()
--------WordsFrequency.java(3KB)
--------ext_stopword.dic(153B)
--------RankAndSummary.java(9KB)
--------SyncoParaAndSen.java(7KB)
--------SentenceExtraction.java(1KB)
--------Syncopate.java(3KB)
--------IKAnalyzer.cfg.xml(472B)
--------SyncoWords.java(2KB)
--------stopwords.dic(9KB)
----input()
--------3.txt(3KB)
--------4.txt(5KB)
--------5.txt(5KB)
--------2.txt(5KB)
--------1.txt(4KB)
----tools()
--------mmseg4j-all-1.8.5.jar(95KB)
--------IKAnalyzer3.2.8.jar(1.12MB)
--------mmseg4j-analysis-1.9.1.jar(9KB)
----.classpath(331B)
----bin()
--------RankAndSummary$1.class(1KB)
--------SentenceExtraction.class(2KB)
--------SyncoParaAndSen.class(4KB)
--------ext_stopword.dic(153B)
--------RankAndSummary.class(6KB)
--------SyncoWords.class(2KB)
--------Syncopate.class(2KB)
--------WordsFrequency.class(3KB)
--------IKAnalyzer.cfg.xml(472B)
--------WordsFrequency$1.class(1KB)
--------stopwords.dic(9KB)