文本向量化WVTool使用 和 原程序讲解

时间:2012-10-02 02:36:59
【文件属性】:

文件名称:文本向量化WVTool使用 和 原程序讲解

文件大小:179KB

文件格式:RAR

更新时间:2012-10-02 02:36:59

文本分类前提 文本向量 WVTool.jar

在我们进行数据挖掘学习的过程中,除了有现成的整理好的数据集供我们使用外,我们还需要自己构建数据集。对于做文本分类的研究者来说,要做的第一步就是要将文本向量化,然后在向量空间中对文本进行研究。这样就出现了一个问题,如何将文本向量化?WVTool是一款开源软件,它主要做文本词频方面的处理,对于实现文本向量化非常有用。它支持对文本、半结构化内容(Html、XML)的向量化处理功能。并且它现在与RapidMiner Data Mining suit (YALE)可以良好的集成,因此它的应用前景还是比较好的。


【文件预览】:
wvtool.jar
WVTool.txt

网友评论

  • 讲解的内容比较少
  • 只有一个jar包,不能执行
  • 参考意义不大
  • 感觉写得不错,非常感谢
  • 还好吧 ,可以学下怎么写
  • 内容比较多,要慢慢理清关系才可以加以利用,有参考价值
  • 不错,很好的中文分类java类库,正在学习使用......
  • 太慢了,效率很低
  • 可惜只有一个jar包,不错还是谢谢啦
  • 原程序讲解的还不够全面。
  • WTool这个工具类的使用说明说的不够清晰 希望改进
  • 只有一个JAR包
  • 可以快捷的用向量形式表征文本内容,很好的工具类。