文件名称:Python-FoolNLTK中文处理工具包号称可能不是最快的开源中文分词
文件大小:58.11MB
文件格式:ZIP
更新时间:2022-08-30 00:09:36
Python开发-自然语言处理
可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典
【文件预览】:
FoolNLTK-master
----train()
--------export_model.py(4KB)
--------data_utils.py(7KB)
--------main.sh(3KB)
--------bi_lstm.py(6KB)
--------norm_train_recoard.py(9KB)
--------prepare_vec.py(2KB)
--------text_to_tfrecords.py(4KB)
--------decode.py(1KB)
--------create_map_file.py(2KB)
--------__init__.py(41B)
--------datasets()
--------README.md(2KB)
--------word2vec.py(1KB)
--------load_model.py(280B)
--------third_party()
----requirements.txt(31B)
----LICENSE(11KB)
----README_CH.md(2KB)
----test()
--------test_dict.txt(103B)
--------loadmodel.py(290B)
--------__init__.py(41B)
--------dictonary.py(577B)
----setup.py(527B)
----README.md(2KB)
----data()
--------pos.pb(54.77MB)
--------map.zip(1.19MB)
--------seg.pb(3.26MB)
--------ner.pb(3.27MB)
----.gitignore(1KB)
----fool()
--------trie.py(4KB)
--------model.py(3KB)
--------__init__.py(3KB)
--------__main__.py(2KB)
--------predictor.py(3KB)
--------dictionary.py(1KB)
--------lexical.py(4KB)