斯皮尔曼相关系数范围_数据的相关系数

时间:2024-10-11 20:39:51

Pearson相关系数

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差标准差的商

从式子(1)能看到,Pearson 系数的取值范围在-1~+1之间,其中1是总正线性相关性,0是非线性相关性,并且-1是总负线性相关性。Pearson相关系数的一个关键数学特性是它在两个变量的位置和尺度的单独变化下是不变的。也就是说,我们可以将X变换为a+bX并将Y变换为c+dY,而不改变相关系数,其中a,b,c和d是常数,b,d > 0。请注意,更一般的线性变换确实会改变相关性。

Pearson 系数的使用场景:

  • 适用于线性相关的情形
  • 样本中存在的极端值对Pearson积差相关系数的影响极大,因此要慎重考虑和处理,必要时可以对其进行剔出,或者加以变量变换,以避免因为一两个数值导致出现错误的结论。
  • Pearson积差相关系数要求相应的变量呈双变量正态分布,注意双变量正态分布并非简单的要求x变量和y变量各自服从正态分布,而是要求服从一个联合的双变量正态分布

Spearman相关系数

Spearman相关系数衡量两个变量依赖性无母数 指标,定义如下

原始数据依据其在总体数据中平均的降序位