文件名称:NLPIR分词、去停用词
文件大小:5.53MB
文件格式:ZIP
更新时间:2022-02-02 03:35:16
NLPIR 分词
整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
文件名称:NLPIR分词、去停用词
文件大小:5.53MB
文件格式:ZIP
更新时间:2022-02-02 03:35:16
NLPIR 分词
整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码