CRF,LSTM,最大后向匹配法实现中文分词

时间:2021-07-08 09:32:51
【文件属性】:

文件名称:CRF,LSTM,最大后向匹配法实现中文分词

文件大小:14.89MB

文件格式:RAR

更新时间:2021-07-08 09:32:51

中文分词

3种中文分词方法:最大后向匹配法,CRF,LSTM。其中LSTM又用了三种方法输入,glove向量,Word2vec向量,还有将字映射成整数再通过embedding层映射成字向量作为输入。还包含中文分词的评分脚本。


【文件预览】:
中文分词
----CRF++()
--------make_crf_train_data.py(1KB)
--------crf_data_2_word.py(1KB)
--------libcrfpp.dll(330KB)
--------crf_test.exe(50KB)
--------make_crf_test_data.py(890B)
--------crf_learn.exe(50KB)
--------read me.docx(68KB)
--------template(238B)
----word2vec向量作为lstm中文分词输入()
--------msr_train.txt(23.26MB)
--------pre_data.py(2KB)
--------word2vec_test.py(4KB)
--------bi_lstm_model.py(569B)
--------word2vec_train.py(3KB)
--------read me.docx(12KB)
----score(7KB)
----lstm()
--------msr_train.txt(23.26MB)
--------test.py(3KB)
--------train.py(2KB)
--------lstm_model.py(817B)
----最大后向匹配()
--------common.py(283B)
--------bwd_max_match.py(2KB)
----分词结果评分.docx(33KB)
----glove向量作为lstm中文分词输入()
--------GloVe-1.2()
--------msr_train.txt(23.26MB)
--------pre_data.py(1KB)
--------glove_test.py(4KB)
--------glove_train.py(3KB)
--------bi_lstm_model.py(569B)
--------获取glove向量运行命令.txt(474B)
--------read me.docx(47KB)

网友评论