金融数据分析(四)-------矩,偏度,峰度

时间:2024-04-12 15:01:53

(1)矩

金融数据分析(四)-------矩,偏度,峰度

(2)--偏度+峰度

 金融数据分析(四)-------矩,偏度,峰度

原文链接: 「量学堂-12」统计动差:偏度和峰度
https://baijiahao.baidu.com/s?id=1569732797373513&wfr=spider&for=pc 

我们把非对称形态的分布称为偏态分布(相对于正态分布而言)。假设这里讨论的分布都是以平均值为0做前提条件,那么存在一种分布,分布曲线上的点由大量的小值正数与少量的大值负数组成,我们称之为正偏态,反之则为负偏态。进一步地我们通过图形化观察一下他们的差异:

金融数据分析(四)-------矩,偏度,峰度

通过上图可以发现:正偏态分布曲线右侧存在着长尾,而负偏态则出现在左侧。正态分布的偏度>0,负偏态分布的偏度<0,对称分布的偏度=0。

此外,正偏态分布有以下特性:众数 < 中位数 < 平均数;对于负偏态单峰分布则恰恰相反,众数 > 中位数 > 平均数。在对称分布中,三值相等。

金融数据分析(四)-------矩,偏度,峰度

下面我们正式给出偏度的计算公式为:

公式中的 n 为数据样本总数,μ 是算数平均值,σ 是标准差。偏度的正负号揭示了刚才讲的偏态方向。

一些时候,我们的数据样本呈现出来的偏态并不明显,但我们仍可以通过计算得出结论。我们来看一个具体的例子,数据样本是2012年至2014年标普500的日收益率。让我们来计算一下偏度、均值和中位数。

金融数据分析(四)-------矩,偏度,峰度

金融数据分析(四)-------矩,偏度,峰度

峰度

峰度用于描述一个分布曲线形态的陡缓程度,通常以正态分布曲线的峰度为参照标准,来观察波峰是更“尖”还是更“平”。我们称正态分布曲线的峰度为常峰度,所有正态分布曲线(无论均值和方差为何值)峰度均为3。峰度大于常峰度的分布叫做尖峰分布(峰度 > 3),它拥有更陡峭的波峰和更厚的尾部,反之亦然,平峰分布拥有更平的波峰和更薄的尾部。

然而,一些工具将分布曲线的超额峰度(峰度减去常峰度3)定义为峰度,这样做的目的是让正态分布的峰度重新定义为0,便于分析比较,如Python的Scipy库就是这样处理的。相比于正态分布,尖峰分布会以更大的降幅速率(下图蓝线的斜率)远离平均值。

金融数据分析(四)-------矩,偏度,峰度

金融数据分析(四)-------矩,偏度,峰度