CSAw - NLP for low-resource languages:CSAw 是一个低资源语言的 NLP 框架-开源

时间:2021-05-29 04:50:15
【文件属性】:
文件名称:CSAw - NLP for low-resource languages:CSAw 是一个低资源语言的 NLP 框架-开源
文件大小:3.9MB
文件格式:ZIP
更新时间:2021-05-29 04:50:15
开源软件 CSAw 是一个面向低资源语言的 NLP 框架,专注于机器翻译。 主要目标是使用基于深度迁移规则的方法从双语文本(例如,正面和背面翻译)自动构建语言模型。 该策略的核心是专为机器翻译设计的概念规范和抽象语义表示。 请参阅此处的预印本文章:https://arxiv.org/abs/1807.02226 当前框架包括转导算法(即从文本到语义表示再返回)和自动语言模型构建所需的一些组件(词汇对齐和语法规则)一代)。 该项目目前尚未完成。 还有更多。
【文件预览】:
Release
----csaw()
--------similarity.py(55KB)
--------alignment.py(121KB)
--------rulemaker.py(120KB)
--------const.py(2KB)
--------csaw.py(1KB)
--------core.py(65KB)
--------utils.py(46KB)
--------trans.py(119KB)
--------interact.py(13KB)
--------lang.py(74KB)
--------traverse.py(8KB)
----docs()
--------The CSAw Framework.pdf(1.3MB)
--------The CSA Semantic Representation.pdf(353KB)
----test.py(1018B)
----.git()
--------index(3KB)
--------hooks()
--------config(311B)
--------description(73B)
--------refs()
--------logs()
--------objects()
--------info()
--------COMMIT_EDITMSG(26B)
--------HEAD(23B)
----tests()
--------testRMEnglish.lex(116KB)
--------testFrench.lng(3KB)
--------testEnglish2.lex(118KB)
--------testE2F.rul(602B)
--------testRMEnglish.lng(2KB)
--------unittests.py(138KB)
--------derived_rules.rul(4KB)
--------testRMEnglish.rul(1B)
--------testEnglish2.rul(34KB)
--------testEnglish2.lng(2KB)
--------testRMtext.txt(9KB)
--------testEnglish1.lng(17KB)
----LICENSE(10KB)
----setup.py(689B)
----README.md(750B)

网友评论