文件名称:wikicite-data:从Wikidata转储中提取,转换和分析书目数据
文件大小:263KB
文件格式:ZIP
更新时间:2024-05-20 20:23:08
JavaScript
WikiCite数据 该存储库包含用于从Wikidata提取,转换和分析书目数据的脚本。 该项目的当前状态是实验性的 概述 可以从每周提供的Wikidata转储中提取书目数据,如。 从2014年10月开始,将旧的JSON转储存储在Internet Archive中。然后,在2014年7月引入了Wikidata JSON转储格式,因此从2013年2月到需要额外的预处理之间的数据。 处理Wikidata转储需要存储,处理时间和知识。 使用此存储库中的脚本,可以对Wikidata转储进行预处理,并以简化的形式提供,更适合使用Wikidata的书目数据。 该存储库还包含校验和,发布类型列表以及从Wikidata转储中获得的统计信息。 不包括完整转储,但必须通过其他方式共享。 数据处理流程 下图说明了将Wikidata转储到书目记录和摘要的过程。 虚线部分不包含在git存储库中。 灰色部分尚未实
【文件预览】:
wikicite-data-master
----.gitignore(133B)
----stats.json(11KB)
----dataflow.dot(829B)
----20210329()
--------wikidata-20210329.pubtypes(27KB)
--------wikidata-20210329-all.md5(33B)
--------wikidata-20210329.classes.count(8B)
--------wikidata-20210329-all.ids.count(9B)
--------wikidata-20210329-publications.ids.count(9B)
----package.json(664B)
----Makefile(3KB)
----package-lock.json(774KB)
----LICENSE.md(7KB)
----download-dump-bz2(622B)
----js()
--------identifier-properties.js(773B)
--------doi.js(457B)
--------subclasses.js(770B)
--------citations.js(427B)
--------wikidata-classes.js(511B)
--------identifiers.js(809B)
--------wikidata-instances.js(521B)
--------wikicite-extract.js(479B)
--------lib()
----download-dump(582B)
----README.md(5KB)
----20210111()
--------wikidata-20210111-all.ids.count(9B)
--------wikidata-20210111.pubtypes(26KB)
--------wikidata-20210111-publications.ids.count(9B)
--------wikidata-20210111-all.md5(33B)
--------wikidata-20210111.classes.count(8B)
----stats.pl(2KB)
----.npmignore(66B)
----dataflow.png(57KB)