为什么样本方差(sample variance)的分母是 n-1?

(補充一句哦,題主問的方差 estimator 通常用 moments 方法估計。如果用的是 ML 方法,請不要多想不是你們想的那樣, 方差的 estimator 的期望一樣是有 bias 的,有興趣的同學可以自己用正態分佈算算看。)

本來,按照定義,方差的 estimator 應該是這個:
为什么样本方差(sample variance)的分母是 n-1?但,這個 estimator 有 bias,因為:
为什么样本方差(sample variance)的分母是 n-1?
而 (n-1)/n * σ² != σ² ,所以,為了避免使用有 bias 的 estimator,我們通常使用它的修正值 S²:
为什么样本方差(sample variance)的分母是 n-1?

上面有答案解释得很明确,即样本方差计算公式里分母为为什么样本方差(sample variance)的分母是 n-1?的目的是为了让方差的估计是无偏的。无偏的估计(unbiased estimator)比有偏估计(biased estimator)更好是符合直觉的,尽管有的统计学家认为让mean square error即MSE最小才更有意义,这个问题我们不在这里探讨;不符合直觉的是,为什么分母必须得是为什么样本方差(sample variance)的分母是 n-1?而不是为什么样本方差(sample variance)的分母是 n-1?才能使得该估计无偏。我相信这是题主真正困惑的地方。

为什么样本方差(sample variance)的分母是 n-1?.
首先,我们假定随机变量为什么样本方差(sample variance)的分母是 n-1?的数学期望为什么样本方差(sample variance)的分母是 n-1?是已知的,然而方差为什么样本方差(sample variance)的分母是 n-1?未知。在这个条件下,根据方差的定义我们有
为什么样本方差(sample variance)的分母是 n-1?

为什么样本方差(sample variance)的分母是 n-1?.

因此为什么样本方差(sample variance)的分母是 n-1?方差为什么样本方差(sample variance)的分母是 n-1?的一个无偏估计,注意式中的分母不偏不倚正好是为什么样本方差(sample variance)的分母是 n-1?

现在,我们考虑随机变量为什么样本方差(sample variance)的分母是 n-1?的数学期望为什么样本方差(sample variance)的分母是 n-1?是未知的情形。这时,我们会倾向于无脑直接用样本均值为什么样本方差(sample variance)的分母是 n-1?替换掉上面式子中的为什么样本方差(sample variance)的分母是 n-1?。这样做有什么后果呢?后果就是,
如果直接使用为什么样本方差(sample variance)的分母是 n-1?作为估计,那么你会倾向于低估方差!
为什么样本方差(sample variance)的分母是 n-1?
换言之,除非正好为什么样本方差(sample variance)的分母是 n-1?,否则我们一定有
为什么样本方差(sample variance)的分母是 n-1?,
这个不等式说明了,为什么直接使用为什么样本方差(sample variance)的分母是 n-1?会导致对方差的低估。

那么,在不知道随机变量真实数学期望的前提下,如何“正确”的估计方差呢?答案是把上式中的分母为什么样本方差(sample variance)的分母是 n-1?换成为什么样本方差(sample variance)的分母是 n-1?,通过这种方法把原来的偏小的估计“放大”一点点,我们就能获得对方差的正确估计了:
为什么样本方差(sample variance)的分母是 n-1?

至于为什么分母是为什么样本方差(sample variance)的分母是 n-1?而不是为什么样本方差(sample variance)的分母是 n-1?或者别的什么数,最好还是去看真正的数学证明,因为数学证明的根本目的就是告诉人们“为什么”;暂时我没有办法给出更“初等”的解释了。

样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差。取分母n-1,可使样本方差的期望等于总体方差,即这种定义的样本方差是总体方差的无偏估计。 简单理解,因为算方差用到了均值,所以*度就少了1,自然就是除以(n-1)了。


Sample variance[edit]

Main article: Sample variance

The sample variance of a random variable demonstrates two aspects of estimator bias: firstly, the naive estimator is biased, which can be corrected by a scale factor; second, the unbiased estimator is not optimal in terms of mean squared error (MSE), which can be minimized by using a different scale factor, resulting in a biased estimator with lower MSE than the unbiased estimator. Concretely, the naive estimator sums the squared deviations and divides by n, which is biased. Dividing instead by n − 1 yields an unbiased estimator. Conversely, MSE can be minimized by dividing by a different number (depending on distribution), but this results in a biased estimator. This number is always larger than n − 1, so this is known as a shrinkage estimator, as it "shrinks" the unbiased estimator towards zero; for the normal distribution the optimal value is n + 1.

Suppose X1, ..., Xn are independent and identically distributed (i.i.d.) random variables with expectation μ and variance σ2. If the sample mean and uncorrected sample variance are defined as

为什么样本方差(sample variance)的分母是 n-1?

then S2 is a biased estimator of σ2, because

为什么样本方差(sample variance)的分母是 n-1?

In other words, the expected value of the uncorrected sample variance does not equal the population variance σ2, unless multiplied by a normalization factor. The sample mean, on the other hand, is an unbiased[1] estimator of the population mean μ.

The reason that S2 is biased stems from the fact that the sample mean is an ordinary least squares (OLS) estimator for μ为什么样本方差(sample variance)的分母是 n-1? is the number that makes the sum 为什么样本方差(sample variance)的分母是 n-1? as small as possible. That is, when any other number is plugged into this sum, the sum can only increase. In particular, the choice 为什么样本方差(sample variance)的分母是 n-1? gives,

为什么样本方差(sample variance)的分母是 n-1?

and then

为什么样本方差(sample variance)的分母是 n-1?

Note that the usual definition of sample variance is

为什么样本方差(sample variance)的分母是 n-1?

and this is an unbiased estimator of the population variance. This can be seen by noting the following formula, which follows from the Bienaymé formula, for the term in the inequality for the expectation of the uncorrected sample variance above:

为什么样本方差(sample variance)的分母是 n-1?

The ratio between the biased (uncorrected) and unbiased estimates of the variance is known as Bessel's correction.