SPSS数据抽取
数据抽取一般分为两类:字段拆分和随机抽样
字段拆分
数据抽取,也称为数据拆分,是只保留原数据表中的某些字段、记录的部分信息,形成一个新字段、新记录。
在spss中导入我们需要的数据,变量主要包含如下:
对于身份号码可以获取出生年、月、日
点击转换菜单栏下面的计算变量:
在函数组中选择字符串,在函数和特殊变量中选择Char.Substr(3),双击Char.Substr(3)则函数在数字表达式中显示。
数据CHAR.SUBSTR(身份证号码,7,4),第一个参数是要截取的变量,第二个参数是从哪个下标开始截取,第三个参数是一共要截取几个字符,目标变量起名为“年份”,类型与标签可以设置,点击确定。
同理,月份和日期也是一样的设置,CHAR.SUBSTR(身份证号码,11,2)和CHAR.SUBSTR(身份证号码,13,2)。
随机抽样
随机抽样,是按照随机的原则,也就是保证总体中的每个单位都有同等机会被抽中的原则,进行样本赝本抽取的一种方法。
随机抽样方法主要有简单随机抽样、分层抽样和系统抽样等。
点击数据菜单栏下面的选择个案,在选择框中包含五中方法
1)所有个案:即选择所有个案
2)如果条件满足:可以输入函数进行条件判断来指定个案
3)随机个案样本:可以根据随机百分比来获取,也可以指定要获取的个案数和从哪个个案开始来获取
4)基于时间或个案范围:可以指定观测值,指定第一个个案和最后一个个案
5)使用过滤变量:可以指定某个过滤的变量
我们选择随机个案样本,选择样本大小为20%:
在数据窗口中会生成一个filter_$变量,1表示被选中,0表示没有被选中,左侧的序号也会进行标识。
相关资料链接下载地址:https://download.****.net/download/qq_37050993/10615544