WordAlignment:使用平行语料库进行机器翻译的词对齐

时间:2021-06-23 23:38:29
【文件属性】:
文件名称:WordAlignment:使用平行语料库进行机器翻译的词对齐
文件大小:6.68MB
文件格式:ZIP
更新时间:2021-06-23 23:38:29
Fortran 机器翻译词对齐的 Python 实现。 以 'python .py > ' 运行选项:-n num_lines 从输入文件中获取更少的行 -d 获取非默认文件,例如:sample ibm1.py:实施 IBM 模型 1 ibm2.py:实施 IBM 模型 2 hmm.py:实施 HMM 模型进行字对齐 fastAlign.py:实施快速对齐方法,但使用固定的 lambda 参数 alignIntersect.py:使用基于交集的对齐方式Dice 的系数 modelAgreement.py:为 IBM Model2 实现基于交集的对齐 带有 .a 扩展名的相应名称的文件是从这些模型中获得的前 1000 个句子的对齐,这些模型在英语和法语的完整 hansards 数据上进行训练。 它们可以与分数对齐一起运行以进行 AER 评估。 t_
【文件预览】:
WordAlignment-master
----ibm1.py(4KB)
----score-alignments(3KB)
----data()
--------hansards.a(9KB)
--------hansards.e(9.19MB)
--------hansards.f(11.07MB)
----hmm.py(6KB)
----check-alignments(2KB)
----fulldata_IBM1_1k.a(94KB)
----fullIBM2_1k.a(89KB)
----fullm2_25iter_1k.a(89KB)
----sample.f(26B)
----fastAlign.py(5KB)
----README.md(1KB)
----ibm2.py(4KB)
----modelAgreement.py(6KB)
----align_intersect.py(3KB)
----align(2KB)
----full_aligninter1k.a(45KB)
----sample.e(25B)
----hmm2_5k_1k.a(83KB)
----full_dice_1k.a(204KB)
----full_fAlign_1k.a(89KB)

网友评论