是通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,并据此对变量进行分类的一种统计方法,归结出的因子个数少于原始变量的个数,但是他们又包含原始变量的信息,所以也称为降维
特点:
- 探索数据,当变量之间存在高度相关性的时候我们希望用较少的因子来概括其信息
- 简化数据,把原始变量转化为因子得分后,使用因子得分进行其他分析
- 综合评价,通过每个因子得分计算出综合得分后,对分析对象进行综合评价
因子分析,原始变量会转变为新的因子,这些因子之间的向广西较低,而因子内部的变量相关程度较高
- 因子载荷
每个原始变量和每个因子之间的相关系数,反映你变量对因子的重要性,通过因子载荷值的高低,我们能知道变量在对应因子中的重要性大小
- 变量共同度
变量共同度就是每个变量所包含的信息能够被因子所解释的程度,其取值范围介于0-1之间,越大,该变量能被因子解释的程度越高
- 因子旋转
对因子载荷矩阵进行旋转,使原始变量之间的关系更为突出,从而对因子的解释更加容易
- 因子得分
评价每个个案在每个因子上的分值
适合因子分析标准:
- 变量要求为连续变量,分类变量不适合
- 建议个案数为变量个数的5倍以上
- KMO 检验统计量在0.5以下,不适合。0.7以上
通过分析他们在一段时间内的线上线下行为信息,以找出这些变量的共性,降低分析维度,并对商户进行综合评价
【分析】【降维】【因子】变量移至变量框
【碎石图】用于辅助判断因子个数
【最大方法差】用于更好的解释因子所包含的意义
【确定】spss 考试时运行因子分析
结果解读
检验数据是否适合做因子分析,KMO 为 0.627,可以
变量共同度,显示了原始变量能被提取的因子所表示的程度
累积方差贡献率达到60%即可
判断最佳因子个数,通常选曲线较抖的,所以提取2-3个
计算得到每个商户的综合得分
【转换】【计算变量】根据表旋转平方和结果得知