文件名称:政治网的自动雪球普查-研究论文
文件大小:350KB
文件格式:PDF
更新时间:2024-06-08 14:58:06
sampling theory web mining text
本文为社会科学家研究政治网络解决了一个持久的方法论问题:代表性抽样。 几乎所有现有的政治网研究都是基于不完整的样本,因此缺乏可概括性。 在本文中,我结合了计算机科学和抽样理论的方法,对政治网站进行了自动雪球普查,并构建了一个完整而完整的英语政治网站索引。 我检查了该指数的稳健性,将其用于整个政治网络的描述性统计,并证明了基于临时抽样策略的研究可能会在重要方面产生偏差。 在将来的研究中,可以通过使用该指数作为抽样范围来消除这种偏差。 此外,此处介绍的方法和开源软件可用于为其他在线内容域创建类似的采样框架。