参照:
1、凹凸性
1.1、同济大学高等数学定义
凹凸函数在同济大学高等数学中的定义符合人们的思维定式。在国际上的定义恰好与同济大学高等数学中的定义相反。
1.2、国际上的定义:
国际上的定义刚好与国内的凹凸函数的定义相反。二阶导数大于0,则为凸函数,有极小值;二阶导数小于0,则为凹函数,有极大值(后面涉及到的凹凸函数,均为国际上的定义);
例如:ex的二阶导数大于0,为凸函数;log x的二阶导数小于0,为凹函数;
一元函数可以很容易的判断凹凸性,二元函数如何判断凹凸性?用到了海塞矩阵,根据海塞矩阵的正定性,判断凹凸性。
a)海塞矩阵
A=⎣⎢⎢⎢⎢⎡∂x2∂2Z∂y∂x∂2Z∂x∂y∂2Z∂y2∂2Z⎦⎥⎥⎥⎥⎤
b)正定矩阵
判断海塞矩阵是否为正定矩阵;若所有特征值均不小于零,则称为半正定。 若所有特征值均大于零,则称为正定。特征值怎么求?∣λE−A∣=0,可以求出特征值。若除主对角线上的元素都为0,则主对角线上的值为特征值。detA=∣A∣=对角线元素积。
c)凹凸性判断(正定矩阵为凸函数):
例题1:f(x,y)=x2+5y2−6x+10y+6
海塞矩阵A:
A=⎣⎡20010⎦⎤
所有的特征值均大于0,海塞矩阵为正定矩阵,函数为凸函数。
例题2:f(x,y)=10(y2+4x)2+(1−4y)2
海塞矩阵A:
A=⎣⎡320−160y−160y120y2−160x+32⎦⎤
根据特征值,决定函数的凹凸性。
2、Jensen不等式
2.1、特殊形式
针对于上述的凸函数,直观意义上的凸函数,有特殊形式:
f(2a+b)≥21(f(a)+f(b))=21f(a)+21f(b)
2.2、简单引申
针对于上述的凸函数,λ相当于x1的概率,1−λ相当于x2的概率,则有:
f(λx1+(1−λ)x2)≥λf(x1)+(1−λ)f(x2)
2.3、延申拓展
针对于上述的凸函数,λj为yj概率,且有j∑λj=1,λj≥0,则有:
f(j∑λjyj)≥j∑λjf(yj)
2.4、推论
若 f(x) 为区间R上的凸函数,g(x):R→R 为一任意函数,X 为一取值范围有限的离散变量, E[f(g(X))] 与 E[g(X)] 都存在,则:
f(E[g(X)])≥E[f(g(X))]
证明:
f(E[g(X)])=f(i=1∑npig(xi))≥i=1∑npif(g(xi))=E[f(g(X))]