文件名称:geography_cleaning
文件大小:96KB
文件格式:ZIP
更新时间:2024-04-08 16:55:35
Python
地理清洁 这是用于COG-UK的系统/数据管道运行中使用的地理清理脚本和实用程序的存储库。 作者:爱丁堡大学的Verity Hill。 它以提交的序列元数据为输入,并尝试查找可用的最高分辨率地理数据。 清理adm2以匹配在全局管理数据库(gadm.org)数据库中找到的adm2。 在所有情况下,都使用管道(“ |”)来表示歧义。位置之间带有管道的正确adm2(即,如果在提交时知道歧义)将被接受为输入。 该脚本还将接受有效的NUTS1区域作为输入。这些以及它们的组成adm2在页面底部定义。 输出中的列: 序列名称 ID adm2_raw:输入的adm2,未经编辑 adm2:已处理的adm2,已针对拼写错误进行了更正,并与GADM adm2匹配。请参阅下面的说明。 adm2_source:选项为“ outer_postcode”,“ adm2_raw”,“ cleaned_adm2_raw
【文件预览】:
geography_cleaning-master
----geography_utils()
--------outer_postcodes_latlongs_region.csv(120KB)
--------postcode_to_adm2.tsv(73KB)
--------nuts_to_adm2.tsv(3KB)
--------LAD_UTLA_adm2.csv(27KB)
--------outer_postcode_cleaning.csv(304B)
--------adm2_cleaning.tsv(6KB)
----geography_cleaning.py(22KB)
----README.md(10KB)