文件名称:untreaties:抓取、清理、转换和搜索联合国条约数据
文件大小:637KB
文件格式:ZIP
更新时间:2024-07-08 19:09:39
Python
该存储库包含一组允许检索和转换检索数据的脚本。 如果您发现任何错误或想提出功能建议,请。 欢迎拉取请求! 获取数据 您可以克隆(见下文)或此存储库中包含的数据或使用un_data.py抓取它,这需要pandas 、 requests和beautifulsoup4 。 这些依赖项在requirements.txt中列出。 该脚本将生成index.csv以及一个包含条约数据本身( treaties )的文件夹和一个包含参与者所做声明(包含在declarations )的文件夹。 git clone git@github.com:zmjones/untreaties.git cd untreaties pip install -r requirements.txt python un_data.py 转换数据 脚本utilities.R 包含许多可以更轻松地处理原始数据的函数。 您可以通过简单