wikidata-simplequestions:SimpleQuestions 数据集到维基数据的映射

时间:2024-06-20 08:31:34
【文件属性】:

文件名称:wikidata-simplequestions:SimpleQuestions 数据集到维基数据的映射

文件大小:40.42MB

文件格式:ZIP

更新时间:2024-06-20 08:31:34

benchmark wikidata question-answering freebase JupyterNotebook

简单问题维基数据 该存储库提供了映射到Wikidata的数据集的版本。 描述 数据组织在 6 个文件中: annotated_wd_data_{train, valid, test}{_full}.txt 。 每个文件每行包含一个示例,格式如下: subject [tab] property [tab] object [tab] question ,其中subject 、 property和object是维基数据项目或属性的标识符。 Rxxx属性标识符对维基数据属性Pxxx的逆属性进行编码。 例如, R19编码属性“出生地”,即P19 (“出生地”)的倒数。 请注意,并非每个翻译的三元组都必须存在于维基数据中。 从 Freebase 迁移到 Wikidata 时的部分信息丢失了。 以“_answerable”结尾的文件只包含维基数据中的三元组。 映射代码在build.ipynb文件中。


【文件预览】:
wikidata-simplequestions-master
----answerable.py(1KB)
----annotated_wd_data_valid.txt(297KB)
----LICENSE.txt(19KB)
----annotated_wd_data_test_answerable.txt(337KB)
----build.ipynb(9KB)
----annotated_wd_data_valid_answerable.txt(169KB)
----.idea()
--------vcs.xml(180B)
----SimpleQuestions_v2()
--------LICENSE.txt(19KB)
--------README.txt(4KB)
--------annotated_fb_data_test.txt(2.92MB)
--------annotated_fb_data_valid.txt(1.46MB)
--------annotated_fb_data_train.txt(10.22MB)
----README.md(3KB)
----mid_to_qid.tsv(68.13MB)
----annotated_wd_data_test.txt(608KB)
----annotated_wd_data_train.txt(2.04MB)
----qald-format()
--------annotated_wd_data_test.json(5.84MB)
--------annotated_wd_data_test_full.json(2.04MB)
--------annotated_wd_data_valid.json(2.81MB)
--------annotated_wd_data_valid_full.json(989KB)
--------annotated_wd_data_train_full.json(7.06MB)
--------annotated_wd_data_train.json(7KB)
----annotated_wd_data_train_answerable.txt(1.14MB)

网友评论