文件名称:结巴分词Python代码
文件大小:6.09MB
文件格式:ZIP
更新时间:2017-09-15 14:10:56
中文 英文 分词
结巴分词,很不错的分词工具,python写的,亲身试用,不管英文还是中文分得很准!
【文件预览】:
jieba-0.32
----PKG-INFO(247B)
----jieba()
--------posseg()
--------__init__.py(12KB)
--------dict.txt(5.17MB)
--------analyse()
--------finalseg()
----test()
--------test_pos_no_hmm.py(5KB)
--------test_cutall.py(5KB)
--------test_change_dictpath.py(860B)
--------test.py(5KB)
--------test_tokenize.py(5KB)
--------test_whoosh.py(2KB)
--------test_tokenize_no_hmm.py(6KB)
--------test_no_hmm.py(5KB)
--------test_pos_file.py(426B)
--------test_bug.py(169B)
--------test_pos.py(5KB)
--------test_multithread.py(856B)
--------test_userdict.py(726B)
--------test_cut_for_search.py(5KB)
--------test_whoosh_flie.py(1KB)
--------test_whoosh_flie_read.py(818B)
--------test_file.py(413B)
----setup.py(405B)