tfidf特征提取

时间:2018-11-11 08:48:55
【文件属性】:

文件名称:tfidf特征提取

文件大小:1.32MB

文件格式:RAR

更新时间:2018-11-11 08:48:55

IK分词 tfidf特征

代码对10个txt文件进行分词、去除停止词,并提取每个词的tfidf特征值输出


【文件预览】:
TextProcessing
----.DS_Store(10KB)
----TextProcessing.iml(649B)
----src()
--------FeatureArray.java(2KB)
--------.DS_Store(6KB)
--------Line.java(3KB)
--------TextProcessing.java(4KB)
--------stopword.dic(9KB)
--------IKAnalyzer.cfg.xml(414B)
--------FileReading.java(1KB)
----.idea()
--------libraries()
--------misc.xml(3KB)
--------compiler.xml(782B)
--------uiDesigner.xml(9KB)
--------workspace.xml(46KB)
--------.name(14B)
--------encodings.xml(159B)
--------modules.xml(268B)
--------copyright()
--------vcs.xml(164B)
----lily()
--------Stock.txt(110KB)
--------.DS_Store(6KB)
--------Basketball.txt(138KB)
--------WorldFootball.txt(107KB)
--------V_Suggestions.txt(110KB)
--------Mobile.txt(79KB)
--------._Basketball.txt(4KB)
--------._.DS_Store(4KB)
--------._WarAndPeace.txt(5KB)
--------FleaMarket.txt(83KB)
--------JobExpress.txt(314KB)
--------WarAndPeace.txt(117KB)
--------D_Computer.txt(341KB)
--------Girls.txt(144KB)
----outFile()
--------Stock.txt(25.01MB)
--------.DS_Store(6KB)
--------Basketball.txt(24.09MB)
--------WorldFootball.txt(22.59MB)
--------V_Suggestions.txt(23.13MB)
--------Mobile.txt(25.95MB)
--------._.DS_Store(4KB)
--------FleaMarket.txt(21.63MB)
--------JobExpress.txt(15.37MB)
--------WarAndPeace.txt(21.12MB)
--------D_Computer.txt(18.73MB)
--------Girls.txt(23.01MB)
----out()
--------.DS_Store(6KB)
--------._.DS_Store(4KB)
--------production()

网友评论