结巴分词Python代码

时间:2017-09-15 14:10:56
【文件属性】:

文件名称:结巴分词Python代码

文件大小:6.09MB

文件格式:ZIP

更新时间:2017-09-15 14:10:56

中文 英文 分词

结巴分词,很不错的分词工具,python写的,亲身试用,不管英文还是中文分得很准!


【文件预览】:
jieba-0.32
----PKG-INFO(247B)
----jieba()
--------posseg()
--------__init__.py(12KB)
--------dict.txt(5.17MB)
--------analyse()
--------finalseg()
----test()
--------test_pos_no_hmm.py(5KB)
--------test_cutall.py(5KB)
--------test_change_dictpath.py(860B)
--------test.py(5KB)
--------test_tokenize.py(5KB)
--------test_whoosh.py(2KB)
--------test_tokenize_no_hmm.py(6KB)
--------test_no_hmm.py(5KB)
--------test_pos_file.py(426B)
--------test_bug.py(169B)
--------test_pos.py(5KB)
--------test_multithread.py(856B)
--------test_userdict.py(726B)
--------test_cut_for_search.py(5KB)
--------test_whoosh_flie.py(1KB)
--------test_whoosh_flie_read.py(818B)
--------test_file.py(413B)
----setup.py(405B)

网友评论

  • 很好资源不错
  • 内容不错,可以使用
  • 资源还是很不错的
  • 不错,可以使用,test文件夹下文件可以直接使用