文件名称:CWS, 中文分词ACL2016纸的源代码.zip
文件大小:57.6MB
文件格式:ZIP
更新时间:2022-10-07 12:23:21
开源
CWS, 中文分词ACL2016纸的源代码 CWS这段代码实现了本文中提出的分词算法。Chinese与Hai汉语词切分学研究。 ACL 2016.最近我们改进了系统,coressponding文件将出现在 ACL2017,源代码在上,这个 repo 是1.更新使用dynet
【文件预览】:
CWS-master
----data()
--------pku_dev(642KB)
--------numbers(1KB)
--------msr_dev(1.54MB)
--------dic(0B)
--------pku_test(675KB)
--------msr_test(706KB)
--------pku_train(6.34MB)
--------msr_train(13.35MB)
--------pku_train_all(6.97MB)
--------idioms(446KB)
--------msr_train_all(14.9MB)
--------split.py(349B)
----result()
--------best_pku(674KB)
----src()
--------tools.py(7KB)
--------test.py(3KB)
--------train.py(2KB)
--------dy_model.py(11KB)
--------best_pku.npz(2.85MB)
--------dy_test.py(1KB)
--------score(7KB)
--------preprocess.py(3KB)
--------best_pku_config(131KB)
--------model.py(13KB)
--------score.py(307B)
----w2v()
--------c_vecs_90(7.43MB)
--------c_vecs_60(5.5MB)
--------c_vecs_70(6.14MB)
--------c_vecs_50(4.85MB)
--------w2v.py(1KB)
--------c_vecs_100(8.07MB)
--------c_vecs_80(6.78MB)
----README.md(2KB)
----cleargit.sh(156B)
----original()
--------pku_test_gold.utf8(701KB)
--------msr_training.utf8(16.11MB)
--------pku_training.utf8(7.37MB)
--------msr_test_gold.utf8(749KB)
----CD_ACL2016.pdf(752KB)