离群值的识别方式

时间:2024-03-22 08:55:42

箱式图方法

箱式图使用了变量的5个指标构成:最小值,下四分位数(P25),中位数(P50),上四分位数(P75)和最大值。P25,P50和P75构成“箱体”部分,“箱体”中间的横线表示P50,即中位数;
如何观察异常值?

四分位距IQR=Q3-Q1
上限是非异常范围内的最大值, 上限=Q3+1.5IQR
下限是非异常范围内的最小值,下限=Q1-1.5IQR
离群值的识别方式

拉依达准则

适用于服从正态分布的数据。需要计算出数据的均值(μ)和标准差(σ),大于μ+3σ或小于μ-3σ的数值为离群值
离群值的识别方式

马氏距离法

马氏距离法是判别多变量离群值的一个常用方法。马氏距离是指多维空间的的一种距离测量,距离大小的评价由分布来确定,如果某个个体的马氏距离大于临界值,就可以认为在检验水准α下,该个体为离群值,这里的检验水准一般为0.005或0.001;临界值的计算与检验标准和*度相关。
离群值的识别方式

相关文章