relation-extraction-pipeline:关系提取系统的训练管道

时间:2021-06-27 17:26:55
【文件属性】:
文件名称:relation-extraction-pipeline:关系提取系统的训练管道
文件大小:46KB
文件格式:ZIP
更新时间:2021-06-27 17:26:55
Java 自述文件 这是为称为 MultiR 的关系提取系统创建训练(和测试)数据的管道。 请注意,所包含的实现应被视为“基线”。 鼓励进一步发展。 虽然此时包含的资源仅支持英语,但管道的设计允许使用其他语言资源。 管道的组件 语料库转换 - 接口:CorpusConverter - 将语料库转换为管道使用的数据结构,例如,Gigaword 到 AnnotatedDoc 文档处理 - 接口:DocProcessor - 执行识别文本中的实体所需的任何操作。 用于 MultiR 的预处理和特征生成。 实体链接 - 接口:链接器 - 获取在文档处理步骤中找到的提及并将它们链接到实体数据库 (Freebase) 中的候选实体。 Relation Annotation - 接口: RelationAnnotator - 查找候选实体之间的关系并使用它们来生成句子注释。 MultiR 编译 -(没有接
【文件预览】:
relation-extraction-pipeline-master
----src()
--------main()
----scripts()
--------entityAliasFileFromFreebase.sh(899B)
--------relationFilesFromFreebase.sh(657B)
--------README-scripts(774B)
----README.md(15KB)
----pom.xml(2KB)
----data()
--------examples()

网友评论