文件名称:annotated_jieba:对中文分词jieba (python版)的注解
文件大小:10.93MB
文件格式:ZIP
更新时间:2024-05-18 22:47:44
Python
对中文分词jieba (python版)的注解 本项目是注释版的 jieba 0.37 源码, 原始代码来自: 。 (代码正在阅读中,后续对加上相应的注释, ) Have fun! Daniel Wang 2015年 8 月 23 日
【文件预览】:
annotated_jieba-master
----MANIFEST.in(32B)
----extra_dict()
--------dict.txt.small(1.48MB)
--------stop_words.txt(222B)
--------dict.txt.big(8.19MB)
--------idf.txt.big(3.9MB)
----jieba()
--------posseg()
--------__main__.py(2KB)
--------__init__.py(20KB)
--------dict.txt(4.84MB)
--------analyse()
--------_compat.py(1021B)
--------finalseg()
----test()
--------test_pos_no_hmm.py(5KB)
--------test_cutall.py(5KB)
--------jieba_test.py(9KB)
--------extract_tags.py(528B)
--------test_change_dictpath.py(873B)
--------test.py(5KB)
--------jiebacmd.py(461B)
--------test_tokenize.py(5KB)
--------demo.py(3KB)
--------test_whoosh.py(2KB)
--------test_tokenize_no_hmm.py(5KB)
--------test.txt(118B)
--------test_lock.py(1KB)
--------extract_tags_with_weight.py(895B)
--------test_no_hmm.py(5KB)
--------test_pos_file.py(403B)
--------test_bug.py(199B)
--------parallel()
--------test_whoosh_file.py(1KB)
--------test_pos.py(5KB)
--------test_multithread.py(830B)
--------test_userdict.py(1KB)
--------extract_topic.py(1KB)
--------test_cut_for_search.py(5KB)
--------extract_tags_idfpath.py(594B)
--------foobar.txt(11B)
--------test_whoosh_file_read.py(826B)
--------lyric.txt(721B)
--------userdict.txt(130B)
--------test_file.py(383B)
--------extract_tags_stop_words.py(658B)
----README_jieba.txt(27KB)
----LICENSE(1KB)
----setup.py(2KB)
----Changelog(6KB)
----README.md(433B)
----code_read_test()
--------init_dag_test.py(6KB)
--------dag_test.png(11KB)