子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

时间:2024-04-04 08:51:55

子空间 subspace

  • 定义

子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)是线性空间子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)的非空子集,则子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)的子空间的充要条件是:

(1)若子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces),则子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

(2)若子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces),则 子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

简单的说,子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)的子空间  :=   W是向量空间 + W是V的子集

  • 理解

原空间也是原空间的一个子空间 ,最小的子空间是0空间 。

 封闭性,这就是“子”的性质,那么你肯定会问这与原空间的定义有什么区别,其实没啥区别,原空间也是原空间的一个子空间,只不过这个子空间是最大的子空间,而最小的子空间是0空间,在这之间有一系列子空间,如直线,平面等等,唯一一点就是这些子空间的标志性特征在于它们都是封闭的线性空间,而类似两条直线或者两个平面构成的元素集就不可以称为一个子空间,其实稍微说得深一些,任何有限个子空间的并集都不可能构成原空间。

三维空间的(真)子空间是平面,平面的(真)子空间是线。

真-子空间满足两点:(1)子集   (2) 降维

  • 应用

SVD 奇异值分解

假如我们在三维空间内有一些离散分布的数据点,但是这些数据点近似分布在一个二维子平面内,可能有一些偏差,那么奇异值分解所做的就是寻找这个最佳的二维子平面,从而拟合三维空间的数据点分布,这种用子空间去拟合数据的方式实际上就是一般说的线性拟合方法,这里就涉及到了子空间,下面的图直观感受一下svd。

子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

在上图中,蓝色的数据点近似分布在一个二维平面内,svd寻找到了表示这个二维平面的两个基向量,就是左图中红色的箭头,然后将数据点投影到这个平面内得到右图所示的数据点近似结果。

线性代数中的4个基本子空间

https://www.jianshu.com/p/3f0b5e91ae64

(1)零空间
        矩阵A的零空间就Ax=0的解的集合。假设矩阵的秩为r,矩阵为m*n的矩阵,则零空间的维数为n-r。因为秩为r,则*变量的个数为n-r,有几个*变量,零空间就可以表示层几个特解的线性组合,也即是零空间的维数为*变量的个数。

(2)列空间
       矩阵A的列空间就是矩阵A中各列的线性组合。假设矩阵的秩为r,矩阵为m*n的矩阵,则列空间可以表示为r个主元的线性组合,即零空间的维数为r。

(3)行空间
        在线性代数中,我们一般习惯将矩阵看出是一组列向量的组合,matlab中矩阵的存储是按列存储的(c中不是)。因此,我们可以将矩阵A进行转置后来讨论行空间和左零空间。假设转置后的矩阵为AT,则A的行空间就是AT的列空间,A的左零空间为AT的零空间。注意这里AT为n*m的矩阵。则此时行空间的维数为r。

(4)左零空间
       左零空间是ATx=0的解的集合。由于秩为r,则*变量的个数为m-r,即左零空间的维数为m-r。

搞懂这个我还是准备去看MIT 的线性代数了。唉。

 

超平面 hyperplane

  • 定义

超平面H是从n维空间到n-1维空间的一个映射子空间

它的本质是*度比空间维度小1。*度的概念可以简单的理解为至少要给定多少个分量的值才能确定一个点. 例如, 三维空间里的(超)平面只要给定了(x,y,z)中任意两个分量, 剩下的一个的值就确定了. 先确定值的两个分量是*的, 因为它们想取什么值就能取什么值;剩下的那个是"不*的", 因为它的值已经由另外两确定了.

二维空间里的超平面为一条直线. 一维空间里超平面为数轴上的一个点
 

  • 理解

以二维空间分解为例:

①给定空间内一个任意向量如w=(0,1),则wx=0(x∈R,y=1)代表一个过原点的超平面H0,w为该平面的法向量。

②该超平面平移k单位可得另一个超平面Hk,wx=0+k,w仍为该平面的法向量

③由①②可知,对任意一个超平面wx=k,w代表该平面的法向量,k代表截距.

     令k∈R,可得整个空间。

④通过移项,可得二维(n维)空间下任意超平面可表示为wx+b=0,点集wx+b>0,wx+b<0分布在两侧。

参数w为二维(n维)法向量,b为常数(相当于截距)

样本空间中的任意一点 x,到超平面(w,b)的距离,可以表示为子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

 

  • 应用

http://www.sohu.com/a/206572358_160850

强烈推荐

因为二维空间里面,一条直线的方程可以表示为: Ax+By+C=0

三维空间里面,平面的方程可以表示为: Ax+By+Cz+D=0

依次推广,n维空间的超平面方程可以表示为: Ax1+Bx2+Cx3+Dx4+Ex5+Fx6+....+K=0

因为n维空间对应的是n维坐标系,仅仅用x、y、z几个字母较难表示,所以此处用x1、x2、x3、...、xn来表示n维坐标系,各个维度的系数此处也可以用w1、w2、w3、...、wn来表示,所以n维空间里面的超平面方程可以写成如下形式:

w1x1+w2x2+w3x3+w4x4+...+wnxn+b=0

 

仿射变换 affine

  • 定义

Affine Transformation是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”(译注:straightness,即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(译注:parallelness,其实是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变。)。

仿射变换可以通过一系列的原子变换的复合来实现,包括:平移(Translation)、缩放(Scale)、翻转(Flip)、旋转(Rotation)和剪切(Shear)。

子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

  • 应用

​​​​​​​ 一些常用转换矩阵如下:

子空间(subspace) 超平面(hyperplane) 仿射变换(affine) 仿射子空间(affine subspaces)

仿射子空间

  • 定义

​​​​​​​能够找到的文献不多。

最清楚的一句话是,仿射子空间可以看作是线性子空间的平移。

 

参考链接

作者:破魔之箭
链接:https://www.zhihu.com/question/48849797/answer/115314179
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

作者:胡椒_w
链接:https://www.jianshu.com/p/833bf4871bff
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

线性代数笔记1:矩阵的四个基本子空间

4个基本子空间

【线性代数】矩阵的四个基本子空间

漫步线性代数十一—— 四个基本子空间

干货 | 从超平面到SVM(一)

关于线性子空间和仿射子空间的注记​​​​​​​