文件名称:提取出weka格式的文本特征提取java源码
文件大小:3.78MB
文件格式:RAR
更新时间:2015-05-09 09:17:07
提取出weka格式的文本特征提取java源码
这是本人编写的用java进行海量文本特征提取,提取出来的格式是weka数据挖掘工具能够识别的,可以用weka来进行文本的分类和聚类等一些数据挖掘方法。压缩包里面已经有了训练集和测试集这两种文档,大家可以用editplus软件打开,此程序可以针对海量文本进行分类和聚类,但必须用到weka数据挖掘工具。如有不懂的+QQ:10642346。