统计词频,和对文档进行分词处理,计算tf-idf值。

时间:2013-06-09 05:08:14
【文件属性】:

文件名称:统计词频,和对文档进行分词处理,计算tf-idf值。

文件大小:1.2MB

文件格式:RAR

更新时间:2013-06-09 05:08:14

tf-idf

统计词频,和对文档进行分词处理,计算tf-idf值。


【文件预览】:
tfidf
----StdAfx.cpp(292B)
----idf文档.txt(17KB)
----text5.txt(1KB)
----tfidf.opt(53KB)
----tfidf.dsw(533B)
----text7.txt(1KB)
----tfidf.dsp(5KB)
----text6.txt(1KB)
----text1.txt(1KB)
----text4.txt(1KB)
----Debug()
--------tfidf.obj(153KB)
--------vc60.pdb(116KB)
--------vc60.idb(153KB)
--------tfidf1.obj(1KB)
--------tfidf.pch(183KB)
--------StdAfx.obj(2KB)
--------tfidf.ilk(829KB)
--------tfidf.pdb(1.19MB)
--------tfidf.exe(588KB)
----tfidf1.cpp(0B)
----ReadMe.txt(1KB)
----StdAfx.h(667B)
----text3.txt(2KB)
----tfidf.plg(920B)
----tfidf.cpp(5KB)
----tfidf.ncb(33KB)
----词库.txt(1.51MB)
----text9.txt(1KB)
----text8.txt(1KB)
----text2.txt(734B)

网友评论

  • 不错,有助于我
  • 能用 能做成软件就最好了
  • 功能太单一了,不过也可以参考
  • 虽然整个软件的功能很简单,但是对于初学者来说,还是有一定帮助的,帮其进行简单的处理。如果想深入研究,建议用武汉大学沈阳的软件
  • 只有简单的分词,而且通过词库进行tf-idf,只能做数据量很小的情况,没什么价值
  • 太一般了,基本上没有太大的用处。
  • 代码一般般 不是很好
  • 只有简单的分词处理,代码不是很条理
  • 只有简单的分词处理,程序很乱,说明是英文下载网站的说明