NLPIR分词、去停用词

时间:2022-02-02 03:35:16
【文件属性】:

文件名称:NLPIR分词、去停用词

文件大小:5.53MB

文件格式:ZIP

更新时间:2022-02-02 03:35:16

NLPIR 分词

整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码


网友评论