relation-extraction-pipeline:关系提取系统的训练管道

时间:2024-07-17 11:13:35
【文件属性】:

文件名称:relation-extraction-pipeline:关系提取系统的训练管道

文件大小:46KB

文件格式:ZIP

更新时间:2024-07-17 11:13:35

Java

自述文件 这是为称为 MultiR 的关系提取系统创建训练(和测试)数据的管道。 请注意,所包含的实现应被视为“基线”。 鼓励进一步发展。 虽然此时包含的资源仅支持英语,但管道的设计允许使用其他语言资源。 管道的组件 语料库转换 - 接口:CorpusConverter - 将语料库转换为管道使用的数据结构,例如,Gigaword 到 AnnotatedDoc 文档处理 - 接口:DocProcessor - 执行识别文本中的实体所需的任何操作。 用于 MultiR 的预处理和特征生成。 实体链接 - 接口:链接器 - 获取在文档处理步骤中找到的提及并将它们链接到实体数据库 (Freebase) 中的候选实体。 Relation Annotation - 接口: RelationAnnotator - 查找候选实体之间的关系并使用它们来生成句子注释。 MultiR 编译 -(没有接


【文件预览】:
relation-extraction-pipeline-master
----src()
--------main()
----scripts()
--------entityAliasFileFromFreebase.sh(899B)
--------relationFilesFromFreebase.sh(657B)
--------README-scripts(774B)
----README.md(15KB)
----pom.xml(2KB)
----data()
--------examples()

网友评论