word分词器java源码-monoses:无监督统计机器翻译

时间:2024-06-25 16:03:21
【文件属性】:

文件名称:word分词器java源码-monoses:无监督统计机器翻译

文件大小:112KB

文件格式:ZIP

更新时间:2024-06-25 16:03:21

系统开源

word分词器java源码单色 这是我们无监督机器翻译系统的开源实现,在以下论文中进行了描述: Mikel Artetxe、Gorka Labaka 和 Eneko Agirre。 2019。 . 在计算语言学协会第 57 届年会的会议记录中,第 194-203 页。 Mikel Artetxe、Gorka Labaka 和 Eneko Agirre。 2018 年。 . 在2018 年自然语言处理经验方法会议论文集,第 3632-3642 页。 此外,它还包括通过无监督机器翻译诱导双语词汇的工具,如以下论文所述: Mikel Artetxe、Gorka Labaka 和 Eneko Agirre。 2019。 . 在计算语言学协会第 57 届年会的会议记录中,第 5002-5007 页。 如果您将此软件用于学术研究,. 要求 Python 3 with (tested with v0.4) and ,可从你的PATH Java , 在third-party/moses/下编译 , 编译在third-party/fast_align/build/ , 在third-party/phra


【文件预览】:
monoses-master
----train.py(37KB)
----LICENSE.txt(34KB)
----translate.py(4KB)
----bli()
--------pt2dict.py(1KB)
--------induce-dictionary.py(13KB)
----README.md(7KB)
----training()
--------reset-fairseq-iterator.py(1KB)
--------clean-corpus.py(2KB)
--------induce-phrase-table.py(8KB)
--------extract-ngrams.py(2KB)
--------tuning()
--------add-levenshtein.py(2KB)
----.gitignore(89B)
----get-third-party.sh(609B)

网友评论