一. 意义
- 从线性空间的角度看,在一个定义了内积的线性空间里,对一个N阶对称方阵进行特征分解,就是产生了该空间的N个标准正交基,然后把矩阵投影到这N个基上。N个特征向量就是N个标准正交基,而特征值的模则代表矩阵在每个基上的投影长度。 特征值越大,说明矩阵在对应的特征向量上的方差越大,功率越大,信息量越多
- 应用到最优化中,意思就是对于R的二次型,自变量在这个方向上变化的时候,对函数值的影响最大,也就是该方向上的方向导数最大。
- 应用到数据挖掘中,最大特征值对应的特征向量上包含最多的信息量。如果某几个特征值很小,说明这个方向上的信息量很小,可以用来降维,也就是删除小特征值对应方向的数据,只保留大特征值方向对应的数据,这样做以后数据量减少,但有用信息量变化不大。
二. 应用
1. 二次型优化问题:
二次型:, 其中就R是一直的二阶矩阵,R=[1, 0.5; 0.5, 1], x是二维向量,x = [x1; x2]
1)对R进行特征分解,得到特征值:0.5, 1.5, 对应的特征向量[[-0.7071;0.7071], [0.7071;0.7071]
2) 画出y的等高线图:
从图中可以看出,最陡峭的方向(函数值变化最快的方向)归一化以后是[0.7071;0.7071],其对应 的特征值1.5是特征值中最大的。因为在这里这有两个特征值,所以特征值为0.5的对应的特征向量是曲面最平滑的方向。
这一点在分析算法收敛性能的时候需要用到。
应用2 数据降维
https://www.zhihu.com/question/21874816
三. 线性空间中数学定义
1. 特征值和特征向量的数学定义
定义1 设是一个
阶方阵,
是一个数,如果方程
(1)
存在非零解向量,则称为
的一个特征值,相应的非零解向量
称为属于特征值
的特征向量。
(1)式也可写成,
(2)
这是个未知数个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式
(3)
即
上式是以为未知数的一元
次方程,称为方阵
的特征方程. 其左端
是
的
次多项式,记作
,称为方阵
的特征多项式。
=
=
=
显然,的特征值就是特征方程的解.特征方程在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此,
阶矩阵
有
个特征值.
设阶矩阵
的特征值为
由多项式的根与系数之间的关系,不难证明
(ⅰ)
(ⅱ))
若为
的一个特征值,则
一定是方程
的根, 因此又称特征根,若
为方程
的
重根,则
称为
的
重特征根.方程
的每一个非零解向量都是相应于
的特征向量,于是我们可以得到求矩阵
的全部特征值和特征向量的方法如下:
第一步:计算的特征多项式
;
第二步:求出特征方程的全部根,即为
的全部特征值
第三步:对于的每一个特征值
,求出齐次线性方程组:
的一个基础解系,则
的属于特征值
的全部特征向量是
(其中
是不全为零的任意实数).
例如:
求矩阵
的特征值和特征向量
解:的特征多项式
:
=
=
=
所以的特征值为
=
=2(二重根),
.
对于=
=2,解齐次线性方程组
.由
,
得基础解系为:
因此,属于=
=2的全部特征向量为:
不同时为零
.
对于,解齐次线性方程组
.由
,
得基础解系为:
因此,属于的全部特征向量为:
2. 特征向量之间的关系
定理1 属于不同特征值的特征向量一定线性无关.
证明 设是矩阵
的不同特征值,而
分别是属于
的特征向量,要证
是线性无关的.我们对特征值的个数
作数学归纳法证明.
当时,由于特征向量不为零,所以结论显然成立.
当>1时,假设时结论成立.
由于是
的不同特征值,而
是属于
的特征向量,因此
如果存在一组实数使
则上式两边乘以得
另一方面, ,即
两式相减:
由归纳假设, 线性无关,因此
而互不相同,所以
.于是(3)式变为
因,于是
.可见
线性无关.
3. 相似矩阵
定义2 设、
都是
阶方阵,若存在满秩矩阵
, 使得
则称与
相似,记作
,且满秩矩阵
称为将
变为
的相似变换矩阵.
“相似”是矩阵间的一种关系,这种关系具有如下性质:
⑴ 反身性:~
;
⑵ 对称性:若 ~
,则
~
;
⑶ 传递性:若~
,
~
,则
~
.
相似矩阵还具有下列性质:
定理2 相似矩阵有相同的特征多项式,因而有相同的特征值.
证明 设~
, 则存在满秩矩阵
,使
于是:
推论 若阶矩阵
与对角矩阵
相似,则即是
的
个特征值.
定理3 设是矩阵
的属于特征值
的特征向量,且
~
,即存在满秩矩阵
使
,则
是矩阵
的属于
的特征向量.
定理4 阶矩阵
与对角矩阵
相似的充分必要条件是:矩阵
有
个线性无关的分别属于特征值
的特征向量(
中可以有相同的值).
例2 设矩阵,求一个满秩矩阵
,使
为对角矩阵.
1. 求特征值
所以的特征值为
.
2. 根据特征值求特征项向量:
对于 解齐次线性方程组
,得基础解系
,即为
的两个特征向量
对于=2,解齐次线性方程组
,得基础解系
,即为
的一个特征向量
.
3. 判断是否能相似于对角矩阵
显然是线性无关的,且个数为3,所以能相似于对角矩阵,取:
即有:
4. 向量组的正交性
在解析几何中,二维、三维向量的长度以及夹角等度量性质都可以用向量的内积来表示,现在我们把内积推广到维向量中.
定义3 设有维向量
,
,令
=
,则
称为向量
和
的内积.
定义4 令
||=
称||为
维向量
的模(或长度).
定义5 当|| ≠0,|
|≠0时,
称为维向量
、
的夹角.
特别地:当=0时,
,因此有当
=0时,称向量
与
正交.(显然,若
=0,则
与任何向量都正交).
定义6 已知个非零向量
,若
=0
,则称
为正交向量组.
定义7 若向量组为正交向量组,且|
|=1
,则称
为标准正交向量组.
例如,维单位向量组
=
,
,
是正交向量组.
正交向量组有下述重要性质:
定理5 正交向量组是线性无关的向量组
定理6 设向量组线性无关,由此可作出含有
个向量的正交向量组
,其中:
,
,……
再取:
则为标准正交向量组.
上述从线性无关向量组导出正交向量组
的过程称为施密特(Schimidt)正交化过程.它不仅满足
与
等价,还满足:对任何
,向量组
与
等价
例4 设 求一个正交矩阵
,使
为对角矩阵.
解:1. 求特征值:
所以的特征值
,
.
2. 求特征向量及标准正交矩阵:
对于,解齐次线性方程组
,得基础解系:
因此属于的标准特征向量为:
对于,解齐次线性方程组
,得基础解系:
这两个向量恰好正交,将其单位化即得两个属于的标准正交向量:
,
于是得正交矩阵:
易验证:
.
详情见:http://course.tjau.edu.cn/xianxingdaishu/jiao/5.htm
三. 应用