SPSS数据分析—二分类Logistic回归模型

时间:2020-12-24 21:10:33

对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能对连续变量进行分析。

使用线性回归模型可以解决上述的部分问题,但是传统的线性模型默认因变量为连续变量,当因变量为分类变量时,传统线性回归模型的拟合方法会出现问题,因此人们继续发展出了专门针对分类变量的回归模型。此类模型采用的基本方法是采用变量变换,使其符合传统回归模型的要求。根据变换的方法不同也就衍生出不同的回归模型,例如采用Logit变换的Logistic回归模型,采用Probit变换的Probit回归模型等,相比之下,Logistic是使用最为广泛的针对分类数据的回归模型。

Logistic回归模型的适用条件
1.因变量为二分类变量或是某事件的发生率
2.自变量与Logit变换后的因变量呈线性关系
3.残差合计为0,且服从二项分布
4.各观测值之间独立

由于Logistic回归模型的残差项服从二项分布而不是正态分布,因此不能使用最小二乘法进行参数估计,而是要使用最大似然法。

和其他回归分析一样,Logistic回归也放在分析—回归过程下面,下面我们通过一个例子来说明具体操作

收集了一组数据,希望通过这些数据分析出低出生体重儿的影响因素,数据如下
SPSS数据分析—二分类Logistic回归模型

可见,数据集中变量比较多,且数据类型丰富,因变量为二分类变量Low,有两个水平:0-正常体重,1-低出生体重,我们先做一个最简单的单变量Logistic回归,只考虑smoke这个因素

分析—回归—二元Logistic回归

SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型

前面我们只引入了一个自变量,可以看到模型的效果并不理想,而且Logistic回归和传统回归模型一样,也可以引入多个自变量并且可以对自变量进行筛选,尽量引入对因变量存在强影响的自变量,下面我们继续加入自变量并进行筛选
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型
SPSS数据分析—二分类Logistic回归模型