TF-IDF算法常用停用词表

时间:2022-04-07 09:23:27
【文件属性】:

文件名称:TF-IDF算法常用停用词表

文件大小:21KB

文件格式:TXT

更新时间:2022-04-07 09:23:27

TF-IDF 停用词

在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!


网友评论