文件名称:acl2015:ACL2015短论文的实验代码
文件大小:86KB
文件格式:ZIP
更新时间:2024-06-08 12:26:56
Python
acl2015 ACL2015短论文的实验代码 环境设定 克隆存储库,然后打开“ scripts / config.sh”文件,为您的环境编辑环境路径。 (GIZA到您的giza安装目录,TRAVATAR代表Travatar等)。 语料库准备 从以下位置下载Europarl语料库源文件: http://www.statmt.org/europarl/v7/europarl.tgz 并将其解压缩,然后您将获得“ txt”目录,其中包含每种语言的所有程序。 在您可以看到此“ txt”目录的目录中,执行: $ ~/acl2015/europarl-extractor/europarl-extractor/multi-sentence-align-corpus.perl en de es fr it 那么您可以使用XML标签获得统一的程序: aligned/en-de-es-fr-
【文件预览】:
acl2015-master
----scripts()
--------format-corpus.sh(5KB)
--------press-corpus.py(2KB)
--------pivot.sh(16KB)
--------integrate-moses.sh(5KB)
--------integrate-travatar.sh(5KB)
--------filter.sh(664B)
--------pview.py(2KB)
--------integrate.sh(14KB)
--------clone-task.sh(1KB)
--------resume-task.sh(375B)
--------config.sh(467B)
--------test-cascade.sh(4KB)
--------train-lm.sh(949B)
--------reverse.sh(2KB)
--------wait-file.sh(268B)
--------toklow.sh(341B)
--------train.sh(10KB)
--------common.sh(3KB)
--------test.sh(2KB)
--------parse-corpus.sh(2KB)
--------inc-train.sh(15KB)
--------unsanitize.sh(187B)
--------train-t2s.sh(6KB)
--------interleave.py(383B)
--------tune.sh(2KB)
--------filter-moses.sh(903B)
----README.md(2KB)
----europarl-extractor()
--------multi-sentence-align-corpus.perl(9KB)
--------tools()
--------merge.py(2KB)
--------extract.py(2KB)
----.gitignore(19B)
----explib-python()
--------lib()
--------.gitignore(14B)