最优化方法:二、数学基础

时间:2024-03-13 15:22:55

主要参考书目:
1. 最优化方法及其应用/郭科,陈聆,魏友华.-北京:高等教育出版社,2007.7(2013.7重印)

1、二次型与正定矩阵

2、方向导数与梯度

3、Hesse矩阵及泰勒展式

  • Hesse(/ˈhɛsə/)矩阵
    2f(X0)=[2f(X0)x122f(X0)x1x22f(X0)x1xn2f(X0)x2x12f(X0)x222f(X0)x2xn2f(X0)xnx12f(X0)xnx22f(X0)xn2]

    容易发现,当f在X0处二阶偏导连续时,Hesse矩阵对称。
  • 多元向量函数的导数
    H:RnRm,X0Rn,记H(X)=[h1(X),h2(X),,hm(X)]T,在存在的前提下,其导数为:
    m×nH(X0)=[h1(X0)x1h1(X0)x2h2(X0)xnh2(X0)x1h2(X0)x2h2(X0)xnhn(X0)x1hn(X0)x2hn(X0)xn]
  • 泰勒展开
    f:RnR1具有二阶连续偏导数,则
    f(X+P)=f(X)+f(X)T+12PT2f(X)P+o(||P||2).


    f(X+P)=f(X)+f(X)T+12PT2f(X¯)P.

    其中X¯=X+θP,而0<θ<1.
  • 几个公式
    1. n元函数求导和1元函数求导在形式上是一致的:
      例如:
      f(X)=12XTAX+bTX+c


      f(X)=AX+b2f(X)=A
    2. 函数梯度的Jacobi矩阵即为此函数的Hesse矩阵。
      n×nf(X)=2f(X)
    3. ϕ(t)=f(X0+tP),其中f:RnR1,ϕ:R1R1
      则:
      ϕ(t)=f(X0+tP)TPϕ(t)=PT2f(X0+tP)TP

4、极小点的判定条件

  • X是局部极小点+X是内点f(X)=0
  • f(X)=0+X是内点X是驻点

5、锥、凸集、凸锥


  • 设集合CRn.XC及任意的数λ0,均由λXC,则称C为锥。
  • 凸组合
    最优化方法:二、数学基础
    更多有关内容
  • 凸集
    最优化方法:二、数学基础
    特别地,规定空集是凸集。
    更多有关内容
  • 半空间
    aRna0,bR1,则集合{X|aTX>b,XRn}称为Rn中的半空间。
    也就是广义平面分割全空间产生的两部分。
  • 几个定理
    1. 凸集的交集仍是凸集。
    2. 首先引入三个概念:
      锥+凸集=凸锥;凸集+闭集=闭凸集;凸锥+闭集=闭凸锥;
      有定理:
      C为凸集XiC,λi0(i=1,2,,k,k2),i=1kλi=1,i=1kλiXiC.
      C为凸锥XiC,λi0(i=1,2,,k,k2),i=1kλiXiC.
      有限个半空间的交为多面集。
      最优化方法:二、数学基础
  • 极点
    设C为非空凸集,XC,若X不能表示成C中两个不同点的凸组合,换言之,若能表示成两点的凸组合,必有X1=X2=X,则称X是凸集C的极点。
    *类似平面凸多边形的顶点。
  • 极方向
    设C为Rn中的闭凸集,P为非零向量,如果对C中的每一个X都有射线{X+λP|λ0}C,则称向量P为C的方向。又设P1P2是C的两个方向,若对任何正数λ,有P1λP2,则称P1P2是两个不同的方向。若C的方向P不能表示成该集合的两个不同方向的正的线性组合,则称P为C的极方向。
    -几个定理
    C={X|AX=b,X0}为非空集合,P是非零向量,P为C的方向的充要条件是P0AP=0
    最优化方法:二、数学基础
  • 凸集分离定理
    最优化方法:二、数学基础

6、凸函数

  • 一系列定义与性质
    最优化方法:二、数学基础
    最优化方法:二、数学基础
    下半连续
    最优化方法:二、数学基础
  • 凸函数与凸集的关系
    最优化方法:二、数学基础
    最优化方法:二、数学基础
    最优化方法:二、数学基础
  • 凸规划
    最优化方法:二、数学基础
    这个结论很强的,但就是条件太苛刻。
    最优化方法:二、数学基础
    则称为二次凸规划问题。(补图上不全处)

约束问题的最优性条件

  • 约束优化问题的分类
    (1) IP型
    minf(X),s.t.gi(X)0,i=1,2,,l.

    (2) EP型
    minf(X),s.t.hj(X)=0,j=1,2,,m.

    (3) GP型
    minf(X),s.t.{gi(X)0,i=1,2,,l.hj(X)=0,j=1,2,,m.
  • 一阶必要条件
    (1)起作用的约束与不起作用的约束
    最优化方法:二、数学基础
    (2)GP型问题的一阶必要条件(IP和EP可以看做GP的特殊情况)
    最优化方法:二、数学基础
    λigi(X)=0巧妙地体现了只考虑起作用的约束。
    (3)Kuhn-Tucker条件
    最优化方法:二、数学基础
  • 二阶充分条件
    最优化方法:二、数学基础
    事实上我们遇到的函数基本没法这样去验证。

相关文章