文件名称:文本向量化WVTool使用 和 原程序讲解
文件大小:179KB
文件格式:RAR
更新时间:2012-10-02 02:36:59
文本分类前提 文本向量 WVTool.jar
在我们进行数据挖掘学习的过程中,除了有现成的整理好的数据集供我们使用外,我们还需要自己构建数据集。对于做文本分类的研究者来说,要做的第一步就是要将文本向量化,然后在向量空间中对文本进行研究。这样就出现了一个问题,如何将文本向量化?WVTool是一款开源软件,它主要做文本词频方面的处理,对于实现文本向量化非常有用。它支持对文本、半结构化内容(Html、XML)的向量化处理功能。并且它现在与RapidMiner Data Mining suit (YALE)可以良好的集成,因此它的应用前景还是比较好的。
【文件预览】:
wvtool.jar
WVTool.txt