java版ss源码-zap:多语言NLP标注投影

时间:2024-06-24 15:46:40
【文件属性】:

文件名称:java版ss源码-zap:多语言NLP标注投影

文件大小:86.13MB

文件格式:ZIP

更新时间:2024-06-24 15:46:40

系统开源

java版s源码ZAP - 多语言注释投影框架 ZAP是一个用于在平行语料库中投影语言注释的框架。 该框架使我们能够使用称为注释投影或注释传输的方法自动为新语言生成语言资源(例如树库或道具库) 。 下面是英语(顶部)和德语(底部)句对的示例。 英语注释会自动投影到德语句子上,用命名实体、语义角色和 PoS 标签标记它。 包含的组件 该框架将执行注解投影所需的一切都打包在一组非常简单、轻量级的 Java 方法中。 这包括: Syntactic and Semantic Parsers :我们封装了诸如 StanfordNLP、ANNA 和 Mate 等开源库,以便对所有支持的语言轻松执行句法解析和语义角色标记。 词对齐:我们提供了一个启发式对齐类,它使用为大规模平行语料库计算的词翻译概率来自动对齐所有支持的语言对中的句子对。 Annotation Transfer :我们为一系列语言注释提供了注释转移的实现,包括词性标签、命名实体、类型依赖和语义角色。 可视化:我们包含一个名为TheProjector的基于 Web 的 UI,可用于检查句子对齐和注释投影。 本自述文件简要说明了它们的用法


【文件预览】:
zap-master
----.gitignore(298B)
----MAINTAINERS(80B)
----src()
--------main()
--------test()
----CONTRIBUTING.md(2KB)
----LICENSE(1KB)
----doc()
--------img()
----pom.xml(9KB)
----README.md(7KB)
----.gitattributes(47B)

网友评论