deft_corpus:从文本语料库中提取定义和相关的格式脚本

时间:2024-05-23 08:32:29
【文件属性】:

文件名称:deft_corpus:从文本语料库中提取定义和相关的格式脚本

文件大小:8.27MB

文件格式:ZIP

更新时间:2024-05-23 08:32:29

Python

欢迎来到DEFT语料库! 欢迎使用最大的专家注释语料库,以*文本形式进行复杂定义提取。 尘埃落定-该数据与 (DeftEval)相关,我们将在SemEval会议日程安排上发布完整的数据集。 提供培训和开发数据,并且在2020年2月2日SemEval评估期结束后将提供测试数据。您可以从相应教科书中获取完整文本。 语料库的最新版本已于2020年1月16日更新。 有关语料库的注释,架构或一般特征的更多信息,请参见的论文。 资料格式 我们目前正在使用类似CoNLL 2003的格式发布具有以下结构的带注释的数据: TOKEN TXT_SOURCE_FILE START_CHAR END_CHAR TAG TAG_ID ROOT_ID RELATION 字符索引源自臭名昭著的对峙格式。 标签遵循BIO格式,并带有本文概述的标签架构。 DeftEval结果 以下是SemEval 2020任务6


网友评论