当需要判断两种现象或者变量之间是否存在依赖关系,若存在,是什么依赖关系以及依赖程度时,我们就需要对着两种想想或变量进行相关分析。
本文总结了有关相关系数分析方法的示意图,如图1所示:
图1 相关分析方法分类示意图
图1已经给出了相关分析的分类,下面讨论各种分类方法的使用场景以及本人认为比较有趣的相关理论。
1 双变量相关分析
使用场景:只有两个变量
方法:计算相关系数
公式:a)皮尔逊简单相关系数两个变量之间的协方差和标准差的商
当皮尔逊相关系数越小,两个变量的向相关性越低
b)肯德尔等级相关系数
该系数有三种情况,又不常用,在这不予解释
c)斯皮尔曼等级相关系数
2 偏相关分析
使用场景:数据中包含多个变量,多个变量之间可能有相互联系,但是我们只想对其中的两个变量进行分析。在这种情况下,就需要用偏相关分析排除其他变量对着两个观察变量的影响。
3 距离分析
使用场景:数据包含多个变量,将这些变量按照一定的标准(距离)分类,进行聚类分析
从图1中可以看出,距离分析包含许多方法,这里面有个Minkowski方法,即我们常说的闵式距离,是由爱因斯坦在瑞士苏黎世联邦科技大学的数学老师最先提出,表达式为:
这里的参数p是个定值,当它取不同的值时,就是图1中定距测量的其他方法:
a) p=1,D(x,y)表示绝对距离,也叫曼哈顿距离(Manhattan distance)、出租汽车距离或街区距离(city block distance):是计算两个点之间存在障碍物,不能直线到达,拐过一个直角的最小两条直角边的距离。
b) p=2,D(x,y)表示欧氏距离:两点之间的直线距离。
c) ,D(x,y)表示切比雪夫距离,也称棋盘距离:两点之间各坐标数值差的绝对值的最大值。以(x1,y1)和(x2,y2)二点为例,其切比雪夫距离为max(|x2-x1|,|y2-y1|)。
总结:本文总结了相关分析的使用场景和各种相关分析方法及其具体方法,为以后再用SPSS及其他需求来处理数据时需要用到的分析方法提供快速检索。