文件名称:通过结合人类判断和机器学习来识别城市地区:在印度的应用-研究论文
文件大小:1.99MB
文件格式:PDF
更新时间:2024-06-30 08:05:52
论文研究
本文提出了一种将主观评估与机器学习相结合的识别城市地区的方法,并将其应用于印度,该国的多项研究认为官方城市化率被低估。 对于行政上定义的城市、城镇和村庄的代表性样本,在实践中使用谷歌图像的人工判断来确定它们是城市还是农村。 根据两种不同的协议,对四组评估员收集判断,他们对印度和城市问题的熟悉程度各不相同。 然后将基于判断的分类与来自人口普查和卫星图像的数据相结合,以预测样本的城市状况。 应用了 Logit 模型、LASSO 和随机森林方法。 然后使用这些方法来确定印度的每个样本外行政单位在实践中是城市还是农村。 分析并未发现印度的城市化程度比官方宣称的要高得多。 然而,在更细分的层面上存在重要差异,与官方声称的相比,“其他城镇”和“人口普查城镇”更偏农村,一些南部州更偏向城市。 评估者和协议之间人类判断的一致性、众包的容易获得性以及跨方法预测的稳定性,表明所提出的方法是研究城市问题的有前途的途径。