文件名称:RuBQ:通过Wikidata回答问题的俄语数据集
文件大小:14.23MB
文件格式:ZIP
更新时间:2024-05-27 02:27:48
RuBQ:俄罗斯知识库问答和机器阅读理解数据集 在2020年5,我们提出RuBQ的第一个版本(发音['魔方]) -茹ssian知识乙酶Q uestions,一个KBQA数据集包括1500点与他们的英语翻译机沿着复杂程度不同,相应的SPARQL查询俄罗斯的问题,答案,以及Wikidata的子集,其中包含带有俄罗斯标签的实体。 据我们所知,这是第一个俄语KBQA和语义解析数据集。 该数据集被认为是跨语言传输,少量学习或使用合成数据场景进行学习时的开发和测试集。 2020年12月,我们构建了RuBQ的第二个版本。 数据集扩展基于通过搜索引擎查询建议服务获得的问题。 数据集的大小增加了一倍: RuBQ 2.0包含2,910个问题以及答案和SPARQL查询。 我们还使用机器阅读理解功能扩展了数据集:RuBQ 2.0结合了Wikipedia中大多数问题的带有答案的段落。 因此,该数据集现在不仅适用
【文件预览】:
RuBQ-master
----RuBQ_1.0()
--------RuBQ_1.0_dev.json(210KB)
--------RuBQ_1.0_test.json(861KB)
--------README.md(5KB)
--------specification_v1.0.md(3KB)
----LICENSE.txt(20KB)
----README.md(2KB)
----RuBQ_2.0()
--------specification_v2.0.md(3KB)
--------RuBQ_2.0_dev.json(1.18MB)
--------RuBQ_2.0_test.json(4.75MB)
--------README.md(13KB)
--------RuBQ_2.0_paragraphs.json(48.79MB)