多元统计分析04:多元正态分布的抽样分布

时间:2024-04-17 09:02:34

Chapter 4 多元正态分布的抽样分布

一、正态变量二次型的分布

Part 1:分类独立的正态变量二次型

关于正态变量二次型的分布,首先考虑分量独立且同方差的情况。记 \(X=\left(X_1,X_2,\cdots,X_n\right)\'\) 是一个正态随机向量,这里我们首先考虑 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\) 的情况,其中 \(\mu=\left(\mu_1,\mu_2,\cdots,\mu_n\right)\'\)

设非随机矩阵 \(A\) 是一个 \(n\times n\) 的对称矩阵,我们记 \(\xi=X\'AX\) ,称为随机向量 \(X\) 的二次型。下面介绍若干正态随机向量二次型的性质。

结论 1:考虑 \(A=I_n\)\(\mu=0\) 的情况,此时 \(\xi=X\'X\) ,我们由 \(\chi^2\) 分布的定义可得

\[\frac{\xi}{\sigma^2}=\frac{1}{\sigma^2}X\'X\sim\chi^2(n) \ . \]

结论 2:考虑 \(A=I_n\)\(\mu\neq0\) 的情况,此时需要引入非中心 \(\chi^2\) 分布的定义。

如果 \(n\) 维正态随机向量 \(X\sim N(\mu,I_n)\) ,引入非中心参数 \(\delta\) ,满足

\[\delta=\mu\'\mu=\sum_{i=1}^n\mu_i^2 \ , \]

则称 \(\xi=X\'X\) 服从*度为 \(n\) ,非中心参数为 \(\delta\) 的非中心 \(\chi^2\) 分布,记为 \(\xi\sim\chi^2(n,\delta)\)

如果 \(n\) 维正态随机向量 \(X\sim N\left(\mu,\sigma^2I_n\right)\) 且有 \(\sigma^2\neq1\) 时,令

\[Y_i=\frac{1}{\sigma}X_i\sim N\left(\frac{\mu}{\sigma},1\right) \ , \quad i=1,2,\cdots,n \ , \]

\(Y=\left(Y_1,Y_2\cdots,Y_n\right)\'\) ,则有

\[Y\'Y=\frac{1}{\sigma^2}X\'X\sim\chi^2(n,\delta) \ , \quad \delta=\frac{1}{\sigma^2}\mu\'\mu \ . \]

结论 3:考虑 \(A\neq I_n\)\(\mu=0\) 的情况。

\(X\sim N_n\left(0,\sigma^2I_n\right)\)\(A\)\(n\times n\) 对称矩阵且 \({\rm rank}(A)=r\) ,则

\[\frac{1}{\sigma^2}X\'AX\sim\chi^2(r) \quad \iff \quad A^2=A \ . \]

结论 4:考虑 \(A\neq I_n\)\(\mu\neq0\) 的情况。

\(X\sim N_n\left(\mu,\sigma^2I_n\right)\)\(A\)\(n\times n\) 对称矩阵且 \({\rm rank}(A)=r\) ,记 \(\delta=\mu\'A\mu/\sigma^2\) ,则

\[\frac{1}{\sigma^2}X\'AX\sim\chi^2(r,\delta) \quad \iff \quad A^2=A \ . \]

这里我们只对结论 3进行证明。

\(\Longrightarrow\) :因为 \(A\) 是对称矩阵,所以存在正交阵 \(\Gamma\) ,使得

\[\Gamma\'A\Gamma={\rm diag}\left(\lambda_1,\lambda_2,\cdots,\lambda_r,0,\cdots,0\right) \ . \]

\(Y=\Gamma\'X\) ,则有 \(Y\sim N_n\left(0,\sigma^2I_n\right)\) 以及 \(X=\Gamma Y\) ,于是

\[\xi\xlongequal{def}\frac{1}{\sigma^2}X\'AX=\frac{1}{\sigma^2}Y\'\Gamma\'A\Gamma Y=\frac{1}{\sigma^2}\sum_{i=1}^r\lambda_i Y_i^2 \ . \]

\(Y_1,Y_2,\cdots,Y_r\) 相互独立,同服从 \(N(0,\sigma^2)\) 分布。故 \(Y_i^2/\sigma^2\sim\chi^2(1)\ (i=1,2,\cdots,r)\) ,且相互独立。所以 \(\xi\) 的特征函数为

\[\varphi_\xi(t)=\prod_{i=1}^r\left(1-2i\lambda_it\right)^{-1/2} \ . \]

又因为已知 \(\xi\sim\chi^2(r)\) ,故 \(\xi\) 的特征函数为 \((1-2it)^{-r/2}\) 。利用

\[(1-2it)^{r/2}=\left[\prod_{i=1}^r\left(1-2i\lambda_it\right)\right]^{1/2} \ , \]

即可得出 \(\lambda_1=\lambda_2=\cdots=\lambda_r=1\) 的结论,于是

\[{\rm diag}\left(1,\cdots,1,0,\cdots,0\right)=\Gamma\'A\Gamma=\Gamma\'A\Gamma\cdot\Gamma\'A\Gamma=\Gamma\'A^2\Gamma \ . \]

\(A^2=A\) ,即 \(A\) 是对称幂等矩阵。

\(\Longleftarrow\) :因为 \(A\) 是对称幂等矩阵,而对称幂等矩阵的特征值非 \(0\)\(1\) ,且只有 \(r\) 个非 \(0\) 特征值,即存在正交矩阵 \(\Gamma\) ,使得

\[\Gamma\'A\Gamma=\begin{bmatrix} I_r & O \\ O & O \end{bmatrix} \ . \]

\(Y=\left(Y_1,Y_2,\cdots,Y_n\right)\'=\Gamma\'X\) ,即 \(X=\Gamma Y\) ,则有

\[Y\sim N_n\left(0,\sigma^2\Gamma\'I_n\Gamma\right)=N_n\left(0,\sigma^2I_n\right) \ . \]

进而有

\[\frac{1}{\sigma^2}X\'AX=\frac{1}{\sigma^2}Y\'\Gamma\'A\Gamma Y=\frac1{\sigma^2}Y\'\begin{bmatrix} I_r & O \\ O & O \end{bmatrix} Y=\frac{1}{\sigma^2}\sum_{i=1}^rY_i^2 \ . \]

因为 \(Y_i\sim N\left(0,\sigma^2\right) \ (i=1,2,\cdots,r)\) 且相互独立,所以

\[\xi=\frac{1}{\sigma^2}X\'AX=\frac{1}{\sigma^2}\sum_{i=1}^rY_i^2\sim\chi^2(r) \ . \]

关于正态随机向量的二次型和线性函数的独立性问题,还有以下两个结论。

结论 5:二次型与线性函数的独立性:设 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\)\(A\)\(n\times n\) 对称矩阵,\(B\)\(m\times n\) 矩阵,则 \(BX\)\(X\'AX\) 相互独立的充分必要条件是 \(BA=O\)

结论 6:两个二次型的独立性:设 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\)\(A\)\(B\) 均是 \(n\times n\) 对称矩阵,则 \(X\'AX\)\(X\'BX\) 相互独立的充分必要条件是 \(AB=O\)

Part 2:一般情形的正态变量二次型

关于一般情形的正态变量二次型的分布,记 \(X=\left(X_1,X_2,\cdots,X_p\right)\'\) 是一个正态随机向量,这里我们主要考虑 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) 的情况。这里我们要讨论的正态变量二次型的性质,和分量独立且同方差的情形类似,所以我们不再对 \(\mu\) 是否为 \(0\) 展开讨论,因此我们将一般情形的正态变量二次型的性质总结为以下三个结论。

结论 1:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) ,则 \(X\'\Sigma^{-1}X\sim\chi^2(p,\delta)\) ,其中 \(\delta=\mu\'\Sigma^{-1}\mu\)

因为 \(\Sigma>0\) ,由正定矩阵的分解可得 \(\Sigma=CC\'\) ,其中 \(C\) 为非退化方阵。

\(Y=C^{-1}X\) ,即 \(X=CY\) ,则有 \(Y\sim N_p\left(C^{-1}\mu,C^{-1}\Sigma\left(C^{-1}\right)\'\right)\)

因为 \(\Sigma=CC\'\) ,所以 \(Y\sim N_p\left(C^{-1}\mu,I_p\right)\) ,且有

\[X\'\Sigma^{-1}X=Y\'C\'\Sigma^{-1}CY=Y\'Y\sim\chi^2(p,\delta) \ . \]

其中,非中心参数为

\[\delta=\left(C^{-1}\mu\right)\'\left(C^{-1}\mu\right)=\mu\'\Sigma^{-1}\mu \ . \]

结论 2:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\)\(A\)\(p\times p\) 的对称矩阵,且 \({\rm rank}(A)=r\) ,则有

\[(X-\mu)\'A(X-\mu)\sim\chi^2(r) \quad \iff \quad \Sigma A\Sigma A\Sigma=\Sigma A\Sigma \ . \]

\(\Sigma>0\) 可知 \({\rm rank}(\Sigma)=p\) ,且存在正交矩阵 \(\Gamma\)\(\lambda_i\ (i=1,2,\cdots,p)\) ,使得 \(\Sigma=\Sigma^{1/2}\cdot \Sigma^{1/2}\) ,其中

\[\Sigma^{1/2}=\Gamma{\rm diag}\left(\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_p}\right)\Gamma\' \ . \]

\(\Sigma^{1/2}\) 称为 \(\Sigma\) 的平方根矩阵。记

\[\Sigma^{-1/2}=\Gamma{\rm diag}\left(\frac1{\sqrt{\lambda_1}},\frac1{\sqrt{\lambda_2}},\cdots,\frac1{\sqrt{\lambda_p}}\right)\Gamma\' \ , \]

显然有 \(\Sigma^{1/2}\Sigma^{-1/2}=I_p\) 。令 \(Y=\Sigma^{-1/2}\left(X-\mu\right)\) ,则有

\[{\rm Var}(Y)=\Sigma^{-1/2}\Sigma\Sigma^{-1/2}=\Sigma^{-1/2}\Sigma^{1/2}\Sigma^{1/2}\Sigma^{-1/2}=I_p \ . \]

所以有 \(Y\sim N_p\left(0,I_p\right)\) ,且有

\[(X-\mu)\'A(X-\mu)=Y\'\Sigma^{1/2}A\Sigma^{1/2}Y\xlongequal{def}Y\'CY \ . \]

其中 \(C=\Sigma^{1/2}A\Sigma^{1/2}\) ,且 \({\rm rank}(C)={\rm rank}(A)=r\) 。由分类独立的正态变量二次型的结论3可知

\[\begin{aligned} Y\'CY\sim\chi^2(r) \quad & \iff \quad C^2=C \\ \\ &\iff \quad \Sigma^{1/2}A\Sigma^{1/2}\cdot\Sigma^{1/2}A\Sigma^{1/2}=\Sigma^{1/2}A\Sigma^{1/2} \\ \\ &\iff \quad \Sigma A\Sigma A\Sigma=\Sigma A\Sigma \ . \end{aligned} \]

结论 3:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\)\(A\)\(B\)\(p\times p\) 的对称矩阵,则二次型 \((X-\mu)\'A(X-\mu)\) 与二次型 \((X-\mu)\'B(X-\mu)\) 相互独立的充分必要条件为 \(\Sigma A\Sigma B\Sigma=O_{p\times p}\)

\(Y=\Sigma^{-1/2}(X-\mu)\sim N_p\left(0,I_p\right)\) ,则有

\[(X-\mu)\'A(X-\mu)=Y\'\Sigma^{1/2}A\Sigma^{1/2}Y \ ,\\ \\ (X-\mu)\'B(X-\mu)=Y\'\Sigma^{1/2}B\Sigma^{1/2}Y \ . \]

分类独立的正态变量二次型的结论6可知,\(Y\'\Sigma^{1/2}A\Sigma^{1/2}Y\)\(Y\'\Sigma^{1/2}B\Sigma^{1/2}Y\) 相互独立的充分必要条件为

\[\Sigma^{1/2}A\Sigma^{1/2}\cdot\Sigma^{1/2}B\Sigma^{1/2}=O_{p\times p} \quad \iff \quad \Sigma A\Sigma B\Sigma=O_{p\times p} \ . \]

所以 \((X-\mu)\'A(X-\mu)\)\((X-\mu)\'B(X-\mu)\) 相互独立的充分必要条件为 \(\Sigma A\Sigma B\Sigma=O_{p\times p}\)

二、Wishart分布

Part 1:Wishart分布的定义

Wishart分布是一元统计中 \(\chi^2\) 分布的推广,在多元正态总体 \(N_p(\mu,\Sigma)\) 的抽样分布中,Wishart分布常用来刻画样本离差阵的分布。这里我们用 \(n\times p\) 的矩阵 \(X=\left(X_{(1)},X_{(2)},\cdots,X_{(n)}\right)\'\) 来表示随机样本数据阵。

Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(0,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,定义随机阵

\[W=\sum_{\alpha=1}^nX_{(\alpha)}X_{(\alpha)}\'=X\'X \ , \]

则称随机阵 \(W\) 的分布为Wishart分布,记为 \(W\sim W_p(n,\Sigma)\)

非中心Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(\mu,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,记

\[M=\begin{bmatrix} \mu_1 & \cdots & \mu_p \\ \vdots & & \vdots \\ \mu_1 & \cdots & \mu_p \end{bmatrix}=\boldsymbol1_n\mu\' \ , \quad \Delta=M\'M=n\mu\mu\' \ . \]

则称 \(W=X\'X\) 服从非中心参数为 \(\Delta\) 的非中心Wishart分布,记为 \(W\sim W_p(n,\Sigma,\Delta)\)

一般的非中心Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(\mu_\alpha,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,记

\[M=\begin{bmatrix} \mu_{11} & \cdots & \mu_{1p} \\ \vdots & & \vdots \\ \mu_{n1} & \cdots & \mu_{np} \end{bmatrix}=\begin{bmatrix} \mu_{1}\'\\ \vdots \\ \mu_{n}\' \end{bmatrix} \ , \quad \Delta=M\'M=\sum_{\alpha=1}^n\mu_\alpha\mu_\alpha\' \ . \]

则称 \(W=X\'X\) 服从非中心参数为 \(\Delta\) 的非中心Wishart分布,记为 \(W\sim W_p(n,\Sigma,\Delta)\)

在保证抽取的随机样本肯定是同方差的前提下,区分Wishart分布是中心的还是非中心的,以及非中心参数的情况如何,关键在于随机样本是否来自于同一个多元正态总体,以及多元正态总体是否为零均值的。以上三种Wishart分布的非中心参数分别对应了三种不同情况:

  1. 若样本来自于一个零均值多元正态总体,则随机阵 \(W\) 服从中心Wishart分布;
  2. 若样本来自于一个非零均值多元正态总体,则随机阵 \(W\) 服从非中心Wishart分布;
  3. 若样本来自于多个均值不等的多元正态总体,则随机阵 \(W\) 服从一般的非中心Wishart分布。

对于服从Wishart分布的随机阵 \(W\sim W_p(n,\Sigma,\Delta)\) ,参数 \(p\) 称为随机阵 \(W\) 的阶数,参数 \(n\) 称为*度,参数 \(\Sigma\) 对应于多元正态总体中的协方差阵。

Part 2:Wishart分布的性质

关于Wishart分布的性质,有一些结论不需掌握其证明,只需记忆并学会应用即可。

性质 1:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,则样本离差阵 \(A\) 服从Wishart分布,即

\[A=\sum_{\alpha=1}^n\left(X_{(\alpha)}-\bar{X}\right)\left(X_{(\alpha)}-\bar{X}\right)\'\sim W_p\left(n-1,\Sigma\right) \ . \]

性质 2:Wishart分布关于*度 \(n\) 具有可加性:设随机阵 \(W_i\sim W_p\left(n_i,\Sigma\right)\ (i=1,2,\cdots,k)\) 且相互独立,则

\[\sum_{i=1}^kW_i\sim W_p(n,\Sigma) \ , \quad n=n_1+n_2+\cdots+n_k \ . \]

性质 3:Wishart分布具有可线性变换性:设随机阵 \(W\sim W_p(n,\Sigma)\)\(C\)\(m\times p\) 常数矩阵,则

\[CWC\'\sim W_m\left(n,C\Sigma C\'\right) \ . \]

  • 特别地,取 \(C=\sqrt{a}I_p\) ,则有 \(aW\sim W_p\left(n,a\Sigma\right)\)

  • 特别地,取 \(C=l\'=\left(l_1,l_2,\cdots,l_p\right)\) ,则有 \(\xi=l\'Wl\sim W_1\left(n,l\'\Sigma l\right)\) ,即

    \[\frac{\xi}{\sigma^2}=\frac{l\'Wl}{\sigma^2}\sim\chi^2(n) \ , \quad \sigma^2=l\'\Sigma l \ . \]

性质 4:分块Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(0,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,若协方差阵 \(\Sigma\) 和随机阵 \(W\) 可以按照如下形式分块:

\[\Sigma=\left[\begin{array}{c:c} \Sigma_{11} & \Sigma_{12} \\ \hdashline \Sigma_{21} & \Sigma_{22} \end{array}\right]\begin{array}{l} r \\ p-r \end{array} \ , \quad W=\left[\begin{array}{c:c} W_{11} & W_{12} \\ \hdashline W_{21} & W_{22} \end{array}\right]\begin{array}{l} r \\ p-r \end{array}\sim W_p(n,\Sigma) \ , \]

则有 \(W_{11}\sim W_r\left(n,\Sigma_{11}\right),\,W_{22}\sim W_{p-r}\left(n,\Sigma_{22}\right)\) ,且当 \(\Sigma_{12}=O\) 时,\(W_{11}\)\(W_{22}\) 相互独立。

性质 5:条件Wishart分布:设随机阵 \(W\sim W_p(n,\Sigma)\) ,记 \(W_{22\cdot1}=W_{22}-W_{21}W_{11}^{-1}W_{12}\) ,则

\[W_{22\cdot1}\sim W_{p-r}\left(n-r,\Sigma_{22\cdot1}\right) \ , \]

其中 \(\Sigma_{22\cdot1}=\Sigma_{22}-\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12}\) ,且 \(W_{22\cdot1}\)\(W_{11}\) 相互独立。

性质 6:Wishart分布的期望:设随机阵 \(W\sim W_p(n,\Sigma)\) ,则 \({\rm E}(W)=n\Sigma\)

性质 7:观测数据阵的二次型的分布:设 \(X\sim N_{n\times p}\left(M,I_n\otimes\Sigma \right)\)\(A\)\(n\times n\) 的对称矩阵,则二次型 \(X\'AX\sim W_p(r,\Sigma,\Delta)\) ,其中 \(\Delta=M\'AM\) 的充分必要条件为 \(A^2=A\)\({\rm rank}(A)=r\)

性质 8:观测数据阵的二次型的独立性:设 \(X\sim N_{n\times p}\left(M,I_n\otimes\Sigma \right)\)\(A\)\(B\) 均 为 \(n\times n\) 的对称幂等矩阵,则二次型 \(X\'AX\)\(X\'BX\) 相互独立的充分必要条件为 \(AB=O\)

三、Hotelling \(T^2\) 分布

Part 1:Hotelling \(T^2\) 分布的定义

Hotelling \(T^2\) 分布是一元统计中 \(t\) 分布的推广。在一元统计中,服从*度为 \(n\)\(t\) 分布的随机变量被定义为

\[t=\frac{X}{\sqrt{\xi/n}}\sim t(n) \ , \]

其中 \(X\sim N(0,1),\,\xi\sim\chi^2(n)\)\(X\)\(\xi\) 相互独立。如果我们考虑随机变量 \(t^2=nX^2/\xi\) 的分布,并将其推广到多元统计中,即可得到Hotelling \(T^2\) 分布的定义。

Hotelling \(T^2\) 分布:设 \(X\sim N_p\left(0,\Sigma\right)\) ,随机阵 \(W\sim W_p\left(n,\Sigma\right)\ (\Sigma>0,\,n\geq p)\) ,且 \(X\)\(W\)​ 相互独立,定义随机变量

\[T^2=nX\'W^{-1}X \ , \]

则称随机变量 \(T^2\) 的分布为Hotelling \(T^2\) 分布,记为 \(T^2\sim T^2(p,n)\)

非中心Hotelling \(T^2\) 分布:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\mu\neq0\) ,随机阵 \(W\sim W_p\left(n,\Sigma\right)\ (\Sigma>0,\,n\geq p)\) ,且 \(X\)\(W\) 相互独立,定义随机变量

\[T^2=nX\'W^{-1}X \ , \]

则称随机变量 \(T^2\) 的分布为非中心Hotelling \(T^2\) 分布,记为 \(T^2\sim T^2(p,n,\mu)\)

注意到,非中心Hotelling \(T^2\) 分布的非中心参数直接由正态随机向量的均值 \(\mu\) 指定,而非中心Wishart分布的非中心参数则是由定义的矩阵 \(\Delta=n\mu\mu\'\) 指定。

此外,在定义Hotelling \(T^2\) 统计量时,虽然正态随机向量与Wishart随机阵都指定了矩阵参数 \(\Sigma\) ,但是在指定Hotelling \(T^2\) 统计量的参数时并没有出现,这说明Hotelling \(T^2\) 统计量的分布是与参数 \(\Sigma\) 无关的,这一点将作为Hotelling \(T^2\) 分布的性质进行证明。

Part 2:Hotelling \(T^2\) 分布的性质

关于Hotelling \(T^2\) 分布的性质,其结论也是以记忆和应用为主,不需掌握大量证明。

性质 1:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,\(\bar{X}\)\(A\) 分别是样本均值向量和样本离差阵,则统计量

\[\begin{aligned} T^2&=(n-1)\left[\sqrt{n}\left(\bar{X}-\mu\right)\right]\'A^{-1}\left[\sqrt{n}\left(\bar{X}-\mu\right)\right] \\ \\ &=n(n-1)\left(\bar{X}-\mu\right)\'A^{-1}\left(\bar{X}-\mu\right)\sim T^2(p,n-1) \ . \end{aligned} \]

样本均值向量 \(\bar{X}\) 和样本离差阵 \(A\) 的分布分别为

\[\bar{X}\sim N_p\left(\mu,\frac1n\Sigma\right) \ , \quad A\sim W_p(n-1,\Sigma) \ . \]

于是有

\[\sqrt{n}\left(\bar{X}-\mu\right)\sim N_p\left(0,\Sigma\right) \ . \]

又因为 \(\bar{X}\)\(A\) 相互独立,所以 \(\sqrt{n}\left(\bar{X}-\mu\right)\)\(A\) 相互独立。由Hotelling \(T^2\) 分布的定义可知,统计量 \(T^2\sim T^2(p,n-1)\)

性质 2\(T^2\) 分布与 \(F\) 分布之间的关系:设 \(T^2\sim T^2(p,n)\) ,则

\[\frac{n-p+1}{np}T^2\sim F(p,n-p+1) \ . \]

性质 3:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,\(\bar{X}\)\(A\) 分别是样本均值向量和样本离差阵,定义统计量 \(T^2=n(n-1)\bar{X}\'A^{-1}\bar{X}\) 则有

\[\frac{n-p}{n}\frac{T^2}{n-1}\sim F(p,n-p,\delta) \ . \]

其中 \(\delta=n\mu\'\Sigma^{-1}\mu\) 为非中心 \(F\) 分布的非中心参数。

性质 4\(T^2\) 统计量的分布只与 \(p\)\(n\) 有关,与 \(\Sigma\) 无关。

\(U\sim N_p\left(0,I_p\right),\,W_0\sim W_p\left(n,I_p\right)\)\(U\)\(W_0\) 相互独立。

要证 \(T^2\) 统计量的分布与 \(\Sigma\) 无关,只要证对任何随机变量 \(T^2=nX\'W^{-1}X\) ,都与标准正态随机向量 \(U\) 和对应的Wishart统计量 \(W_0\) 构成的 \(T^2\) 统计量 \(T_0^2=nU\'W_0^{-1}U\) 同分布即可。

因为 \(X\sim N_p\left(0,\Sigma\right),\,W\sim W_p\left(n,\Sigma\right)\) ,则有 \(\Sigma^{-1/2}X\sim N_p\left(0,I_p\right)\)\(\Sigma^{-1/2}W\Sigma^{-1/2}\sim W_p\left(n,I_p\right)\) ,故

\[U\xlongequal{d}\Sigma^{-1/2}X \ , \quad W_0\xlongequal{d}\Sigma^{-1/2}W\Sigma^{-1/2} \ . \]

所以有

\[T_0^2=nU\'W_0^{-1}U\xlongequal{d}nX\'W^{-1}X=T^2\sim T^2(p,n) \ . \]

性质 5\(T^2\) 统计量对非退化变换不变:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,记 \(A_x\) 表示样本离差阵,则有

\[T_x^2=n(n-1)\left(\bar{X}-\mu\right)\'A_x^{-1}\left(\bar{X}-\mu\right)\sim T^2(p,n-1) \ . \]

若存在 \(p\times p\) 的非退化常数矩阵 \(C\)\(p\) 维常向量 \(d\) ,使 \(Y_{(\alpha)}=CX_{(\alpha)}+d,\,\alpha=1,2,\cdots,n\) ,则有

\[T_y^2=T_x^2\sim T^2(p,n-1) \ . \]

如果将 \(Y_{(\alpha)},\,\alpha=1,2,\cdots,n\) 写成数据阵的形式,注意到 \(Y=XC\'+\boldsymbol1_pd\'\) ,于是有

\[\bar{Y}=C\bar{X}+d \ , \quad A_y=CA_xC\' \ . \]

于是

\[\begin{aligned} T_y^2&=n(n-1)\left(\bar{Y}-C\mu-d\right)\'A_y^{-1}\left(\bar{Y}-C\mu-d\right) \\ \\ &=n(n-1)\left(\bar{X}-\mu\right)\'C\'\left(C\'\right)^{-1}A_x^{-1}C^{-1}C\left(\bar{X}-\mu\right) \\ \\ &=T_x^2\sim T^2(p,n-1) \ . \end{aligned} \]

注意,这里的 \(T_y^2\)\(T_x^2\) 是严格相等,而不仅仅是同分布。

四、Wilks \(\Lambda\) 分布

Part 1:Wilks \(\Lambda\) 分布的定义

Wilks \(\Lambda\) 分布是一元统计中 \(F\) 分布的推广,而 \(F\) 分布主要用于检验两个正态总体的方差比。在多元统计中,方差变成了协方差阵,不能直接作比,因此我们需要引入一个数值来描述对矩阵的离散程度的估计,所以我们引入了广义方差的概念。
广义方差:对于多元正态总体 \(X\sim N_p(\mu,\Sigma)\) ,我们将协方差阵的行列式 \(|\Sigma|\) 称为 \(X\) 的广义方差;对于来自多元正态总体的简单随机样本 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) ,我们将 \(\left|\dfrac1nA\right|\)\(\left|\dfrac1{n-1}A\right|\) 称为样本广义方差。

Wilks \(\Lambda\) 分布:设 \(A_1\sim W_p\left(n_1,\Sigma\right),\,A_2\sim W_p\left(n_2,\Sigma\right)\ (\Sigma>0,\,n_1\geq p,\,n_2\geq p)\) ,且 \(A_1\)\(A_2\) 相互独立,定义广义方差之比为

\[\Lambda=\frac{\left|A_1\right|}{\left|A_1+A_2\right|} \ , \]

\(\Lambda\) 的分布称为Wilks分布,将 \(\Lambda\) 称为Wilks统计量或 \(\Lambda\) 统计量,记为 \(\Lambda\sim\Lambda(p,n_1,n_2)\)

特别地,当 \(p=1\) 时, \(\Lambda\) 统计量的分布正是一元统计中的Beta分布 \(\Beta(n_1/2,n_2/2)\)

Part 2:Wilks \(\Lambda\) 分布的性质

性质 1:当 \(n_2=1\) 时,设 \(n=n_1>p\) ,则有

\[\begin{aligned} &\Lambda(p,n,1)\xlongequal{d}\frac{1}{1+\dfrac{1}{n}T^2(p,n)} \ . \\ \\ &T^2(p,n)\xlongequal{d}n\cdot\frac{1-\Lambda(p,n,1)}{\Lambda(p,n,1)} \ . \\ \\ &\frac{n-p+1}{np}T^2(p,n)\xlongequal{d}\frac{n-p+1}{n}\frac{1-\Lambda(p,n,1)}{\Lambda(p,n,1)}\xlongequal{d}F(p,n-p+1) \ . \end{aligned} \]

性质 2:当 \(n_2=2\) 时,设 \(n=n_1>p\) ,则有

\[\frac{n-p+1}{p}\frac{1-\sqrt{\Lambda(p,n,2)}}{\sqrt{\Lambda(p,n,2)}}\xlongequal{d}F(2p,2(n-p+1)) \ . \]

性质 3:当 \(p=1\) 时,则有

\[\frac{n_1}{n_2}\frac{1-\Lambda\left(1,n_1,n_2\right)}{\Lambda\left(1,n_1,n_2\right)}\xlongequal{d} F\left(n_2,n_1\right) \ . \]

性质 4:当 \(p=2\) 时,则有

\[\frac{n_1-1}{n_2}\frac{1-\sqrt{\Lambda\left(2,n_1,n_2\right)}}{\sqrt{\Lambda\left(2,n_1,n_2\right)}}\xlongequal{d} F\left(2n_2,2(n_1-1)\right) \ . \]

性质 5:设 \(\Lambda\sim\Lambda\left(p,n_1,n_2\right)\) ,当 \(n_2>2,\,p>2\) 时,可以用 \(\chi^2\) 统计量作为 \(\Lambda\) 统计量的近似,即当 \(n_1\to\infty\) 时,有

\[-r\ln\Lambda\sim\chi^2\left(pn_2\right) \ , \quad r=n_1-\frac12\left(p-n_2+1\right) \ . \]

性质 6:若 \(\Lambda\sim\Lambda\left(p,n_1,n_2\right)\) ,则存在 \(B_k\sim\Beta\left(\dfrac{n_1-p+k}{2},\dfrac{n_2}{2}\right),\,k=1,2,\cdots,p\) 且相互独立,使得

\[\Lambda\xlongequal{d}B_1B_2\cdots B_p \ . \]

该性质说明 \(\Lambda\) 统计量可以看成若干个相互独立的 \(\Beta\) 统计量的乘积。

性质 7:若 \(n_2<p\) ,则

\[\Lambda\left(p,n_1,n_2\right)\xlongequal{d}\Lambda\left(n_2,p,n_1+n_2-p\right) \ . \]

该性质是一元统计中 \(F(n,m)\xlongequal{d}1/F(m,n)\) 的推广。