实验9-SPSS相关分析-超市销售数据
SPSS-“超市销售数据”相关分析
- 在进行数据分析时,不仅仅要描述数据本身呈现出来的基本特征,有时候还需要进一步挖掘变量之间深层次的关系,为后期
- 模型的建立及预测做准备。
- 4.1 相关分析简介
- (1)相关关系
- 相关关系是指现象之间存在着非严格的、不确定的依存关系。
- (2)回归函数关系
- 回归函数关系是指现象之间存在着依存关系。在这种依存关系中,对于某一变量的每一个数值,都有另一变量值
- 与之对应,并且这种依存关系可用一个数学表达式反映出来。
- 线性相关是最常用的一种,即当一个连续变量发生变动时,另一个变量相应地呈现线性关系变动,用皮尔逊相关系数 r
- 来度量。反映连续变量之间线性相关强度的一个度量指标,它的取值范围限于[-1,1]。
- 在进行相关分析之前,通常通过绘制散点图来观察变量间的相关性,如果这些变量在二维坐标中构成的数据点分布在
- 一条直线的周围,那么就说明变量间存在线性相关关系。
- 4.2 相关分析实践
- 通过一个“超市销售数据”用SPSS软件进行相关分析。这是一家超市连续3年的销售数据,包括月份、季度、广告费用、客流量、销售额5个变量,共有36条记录。
- 图1-1 “超市销售数据”示例
- 4.2.1 散点图绘制
- 这组数据是市场销售方面的典型数据,先尝试使用散点图从视觉角度考察“广告费用”和“销售额”是否存在相关性。
- 实验步骤:【图形】-【旧对话框】-【散点图/点图】-“广告费用”变量移至【X轴】-“销售额”变量移至【Y轴】。
- 图1-2 销售额与广告费用关系散点图
- 从“广告费用”与“销售额”两个变量的散点图可以看出,两个变量之间存在明显的线性正相关,销售额”随着“广告费用”的增加而相应增加。
- “
- 4.2.2 相关分析操作
- 【分析】-【相关】-【双变量】
- 图1-3 参数设置
- 依次将“广告费用”、"销售额"两个变量移至【变量】框中。
- 图1-4 相关分析结果
- 可以看到,“广告费用”与“销售额”两个变量间的皮尔逊相关系数 r = 0.816,为高度正相关关系,显著性(P值)=0.000
- 小于0.01,具有极其显著的统计学意义,从实际意义来讲,投入的广告费用越多,销售额也就相应越大。
- 把“广告费用”、“客流量”、“销售额”都移至【变量】框中,很快就得到了三个变量两两之间的相关分析结果。
- 图1-5 相关分析结果
- 从这个相关分析表中可以得知,“广告费用”、“客流量”和“销售额”三个变量两两之间的相关系数 r 都大于0.8,三个变量两两之间都具有高度正相关关系,并且具有极其显著的统计学意义。