文件名称:结巴分词、词性标注以及停用词过滤
文件大小:7.15MB
文件格式:ZIP
更新时间:2019-11-21 16:38:58
python jieba
因为比赛需要用到结巴分词,所以写了一个关于结巴分词、词性标注以及停用词过滤的python程序。
【文件预览】:
test
----pos.txt(52KB)
----test.py(2KB)
----poss.txt(64KB)
----jieba()
--------__init__.pyc(14KB)
--------__init__.py(14KB)
--------_compat.py(775B)
--------finalseg()
--------posseg()
--------dict.txt(5.17MB)
--------__main__.py(2KB)
--------_compat.pyc(1KB)
--------analyse()
----readme.txt(34B)
----stopword.txt(5KB)