Hermite二次型之其他正定性与商
一. 其他正定性
1. 定义
给出“负定的”、“半正定的”与“半负定的”相关结论
注:如果一个H阵(或其对应的二次型)既不是半负定的,也不是半正定的,那么就称这个H阵(或这个二次型f)是不定的。
2. 其他正定性的判定方法
在《【矩阵论】Hermite二次型(2)》中我们讨论了有关正定的二次型的三定理和无等价条件,这些性质和定理都可以很自然地类比到其他正定性的判定方法上。
(1)负定性的判定方法
以下拿负定性的判定举例说明,证明可参考前篇博文,此处不再赘述:
【三定理】
- 如果一个对角阵是负定的,则该对角阵的所有对角元都是负数。
- 如果一个矩阵A与一个矩阵B共轭合同,且A是负定的 ↔ 则B也是负定的。
- 如果一个矩阵A和一个对角阵Λ共轭合同,则A是负定的 ↔ 该对角阵Λ上的所有对角元都是负数。
【五条件】
- A是负定的
- A的特征值均小于零
- A与-I共轭合同
- 存在可逆阵P,使得A = -PHP
- A的奇数阶顺序主子式均小于零,偶数阶顺序主子式均大于零。
【注意】
大部分的定理和条件只是进行了一个等价类比,有关“顺序主子式”的结论需要引起重视:
因为A是负定的 ↔ -A是正定的 ↔ -A的所有顺序主子式都要大于零
考察-A的二阶顺序主子式,发现两行(列)的负号均可以提出,负负得正进行抵消,所以-A的二阶顺序主子式和A的二阶顺序主子式的值是相同的。
【例】二次型/矩阵正定性的证明
在进行正定性证明时候,因为能用到的定理、性质和条件有很多,所以往往会选不准思路,可以基本参照以下思路进行试探:
- 首先考虑正定性的定义,定义是数学概念的基础
- 针对H阵的相关证明,考虑“共轭合同”关系与“对角化”方法
- 运用特征值有关的结论
[1]:根据题目要求,先设出正定矩阵与半正定矩阵,并写出矩阵和的形式
[2]:按照定义,将某个矩阵M代入X0HMX0中,进行符号推导
[3]:一个正数与一个非负数的和一定是正数
(2)半正定性的判定方法
【三定理】
【五条件】
- 注意第三点中给出的矩阵形式就是半正定矩阵所具有的规范形的通式
- 第四点中矩阵P既没有对是否可逆进行限制,也没有对其维度和形状进行限制
现可以进行验证,对于一个矩阵A = PHP,是一个半正定矩阵(对应的二次型是半正定的)
①要证明A是一个H阵,此处显然有AH = A,不再论述
②要证明对于任意一个向量X0(此处向量X0是否为零向量对于证明不影响),都有X0HAX0≥0
本质上利用了内积的非负性,因此对于矩阵P无需做任何限制。
- 第五点中对于主子式去掉了“顺序”的限制
这里不对第五点的定理进行严格的证明,简单论述一下“顺序主子式大于等于零”只能作为矩阵是半正定的必要非充分条件
[非充分性]:对于如下所示的矩阵(对角阵),根据对角线元素显然可知其为一个半负定矩阵,但是其各阶顺序主子式均≥0
若验证其各阶主子式,就会发现,只含有“-1”元素的主子式的值是负的,因此论证了该矩阵并非半正定的。
二. Rayleigh商
从相似标准型到二次型的一系列讨论中,我们引出了很多新的概念和定理,而它们也都围绕着一个很重要的概念——特征值进行讨论。但是到目前为止,我们对于特征值还没有特别好的计算方式,通过解特征方程来求解特征值的方法也过于麻烦。
因此,我们引出Rayleigh商的概念,来辅助求解矩阵的特征值。
1. 定义
2. 相关定理
(1)定理描述
(2)定理证明
特征值的两个最值分别和Rayleigh商的两个最值进行对应,二者的证明思路大致相同,以下只用最小值进行证明。
[1]:因为A是一个n阶H阵,所以A有n个两两正交的单位特征向量,而这n个属于Cn空间的两两正交的单位特征向量可以构成Cn空间的一组标准正交向量基。
这是H阵具有的性质,不太熟悉的读者可以移步《【矩阵论】Hermite二次型(1)》这篇博文,其中对H阵的性质进行了说明与证明。
[2]:因为X∈Cn,所以X也可以用η1,η2,…,ηn这组基进行线性表示,将线性表示的结果代入到XHAX中进行计算。
根据矩阵乘法的结合律,可以先对AX进行计算,因为这组基η1,η2,…,ηn正好是矩阵A的特征值,所以将X矩阵进行列分块后和矩阵A运算就能得到[λ1k1η1,λ2k2η2,…,λnknηn]的结果。
[3]:X向量在Cn中,AX的结果(就是矩阵A的列空间中的某个向量)也在Cn中,形如XH(AX)的运算就是在Cn空间中求解X和AX的标准内积;根据之前我们对于内积的讨论,两个向量的内积可以转换成在同一组基(η1,η2,…,ηn)下的坐标的内积。
[4]:因为λ1是最小的特征值,我们可以对所有的λi进行放缩
此步也是对于最大值和最小值证明的唯一不同处。
如果要证明最大值的结论,只需要用λn对所有的λi进行放大即可。
[5]:Σki共轭ki在标准内积的定义中就是X向量与自身的内积,也即XHX
[6]:综合2-5式,即有不等式XHAX≥λ1XHX,又因为X≠θ,所以XHX>0,不等式两边同时除以XHX,即得到6框中的结论。
注意,λ1≤R(x)这个式子的成立只能说明λ1是R(x)的一个下界,但并不能说明λ1是R(x)的下确界(最小值)。
我们还需要证明,存在某一个X0,能够满足R(X0) = λ1才行。
[7]:找到与λ1对应的那一个特征向量η1,代入运算即可证明λ1就是R(X)的一个下确界。
(3)说明
①该定理只给出了特征值中的两个最值的求解思路,其中间的若干特征值也可以借助R(X)求解,只不过计算比较繁杂。
②该定理成立的重要条件就是矩阵A是一个H阵,因为如果不是H阵,首先就不能保证R(X)是一个实值函数,更别谈其最值的求解了。