文件名称:ist的matlab代码-fast_align:简单,快速的无监督字对齐器
文件大小:24KB
文件格式:ZIP
更新时间:2024-06-15 01:24:49
系统开源
ist的matlab代码fast_align fast_align是一个简单,快速,无监督的字fast_align器。 如果您使用此软件,请引用: , , 和 。 (2013)。 。 在过程中。 NAACL的。 此存储库中的源代码是根据的条款提供的。 输入格式 必须fast_align输入进行标记化,并将其对齐为平行的句子。 每行是源语言句子及其目标语言翻译,由带有前导和尾随空格( ||| )的三重管道符号分隔。 3句德语-英语平行语料库的示例是: doch jetzt ist der Held gefallen . ||| but now the hero has fallen . neue Modelle werden erprobt . ||| new models are being tested . doch fehlen uns neue Ressourcen . ||| but we lack new resources . 编译和使用fast_align 构建fast_align需要现代的C ++编译器和构建系统。 此外,可以使用以下库来获得更好的性能 OpenMP(某
【文件预览】:
fast_align-master
----.gitignore(153B)
----src()
--------atools.cc(11KB)
--------ttables.h(5KB)
--------array2d.h(4KB)
--------port.h(1KB)
--------corpus.h(2KB)
--------da.h(3KB)
--------force_align.py(3KB)
--------alignment_io.cc(3KB)
--------ttables.cc(495B)
--------hashtables.h(450B)
--------alignment_io.h(1KB)
--------fast_align.cc(17KB)
----LICENSE.txt(10KB)
----README.md(3KB)
----cmake()
--------FindSparseHash.cmake(428B)
----CMakeLists.txt(650B)