文件名称:EuropeanaHarvest:从维基共享资源中收集元数据以供欧洲使用的脚本
文件大小:1.22MB
文件格式:ZIP
更新时间:2024-06-26 17:34:16
Python
欧洲收割机 从维基共享资源中收集元数据以供欧洲使用的脚本 在 json 文件中给定一组(一组)类别以及模板和外部链接的匹配模式(参见项目文件夹中的示例); 它查询 Commons API 以获取有关图像的元数据,并通过调查每个文件页面上使用的模板和外部链接进行跟进。 根据 Europeana 规范,结果信息将输出到 xml 文件中。 此外,数据(连同一些未使用的字段)作为 csv 输出,以允许更容易的分析/后处理以及对使用类别的分析和详细说明数据中潜在问题的日志文件。 对于懒惰/频繁使用,在 Wikimedia Commons 上将用户名/密码粘贴到 config.py 中作为变量用户/密码(在 unicode 中)。 如果没有按下,则导入 getpass 并用于提示输入用户名和密码。 用法: python Europeana.py filename option ,其中: fil
【文件预览】:
EuropeanaHarvest-master
----output()
--------wlm-se.xml(13.38MB)
--------då-och-nu-2014.xml(55KB)
----WikiApi.py(36B)
----LICENSE(1KB)
----creditStrings.json(10KB)
----README.md(1KB)
----Europeana.py(40KB)
----.gitignore(69B)
----projects()
--------wlm-se.json(921B)
--------då-och-nu.json(377B)