Python-百度的中文开源词法分析工具LAC

时间:2022-08-30 20:08:52
【文件属性】:

文件名称:Python-百度的中文开源词法分析工具LAC

文件大小:85KB

文件格式:ZIP

更新时间:2022-08-30 20:08:52

Python开发-机器学习

中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程。因为在汉语中,词是承担语义的最基本单位,切词是文本分类、情感分析、信息检索等众多自然语言处理任务的基础。


【文件预览】:
baidu-lac-6d193d4
----conf()
--------customization.dic.example(127B)
--------model()
--------q2b.dic(128B)
--------tag.dic(128B)
--------customization.dic(0B)
--------strong_punc.dic(127B)
--------word.dic(131B)
----.gitattributes(92B)
----AUTHORS(318B)
----src()
--------customization_tagger.h(3KB)
--------main_tagger.h(5KB)
--------main_tagger.cpp(12KB)
--------lac.cpp(13KB)
--------lac.h(5KB)
--------customization_tagger.cpp(6KB)
--------lac_glb.h(3KB)
--------lac_util.h(1KB)
--------lac_util.cpp(2KB)
--------ilac.cpp(2KB)
----CMakeLists.txt(3KB)
----LICENSE(11KB)
----test()
--------src()
----README.md(18KB)
----data()
--------test_data()
--------train_data()
----python()
--------train.py(11KB)
--------reader.py(3KB)
--------network.py(4KB)
----include()
--------ilac.h(2KB)

网友评论