本来想直接去学习机器学习的算法的,后来想想还是需要先把基础的数学概念性的看一下,所以决定先从数学知识看起来吧。这里也对微积分做一点基础概念的理解,大学时候的数学也有很多已经遗忘了.这里总结下微积分的一些知识,用作后面的学习。
1 极限
设f(x)定义在x0的一个可能不包括x0的区间上,我们说当x趋于x0时,f(x)趋于极限L,并记为:
1.1 三明治(夹逼)定理
假设在包含c在内的某个开区间中除x = c外所有的x,有
简言之就是g(x)和h(x)在x趋向于c的时候的极限为L,那么在中间的那个f(x)的极限也就是L了。
下面举两个例子来求极限:
1.1.1 求sin(x)/x的极限
如图所示
1.1.2 求(1+1/n)^n的极限
其实这个极限的值为自然数e。
2 导数
2.1 导数的定义
其实导数就是切线的斜率,是一条曲线变换快慢的反应。
2.2 常用导数
|
|
---|---|
C | 0 |
sinx | cosx |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 微分
3.1 微分的定义
函数y=f(x)在某区间有定义,
可表示为
那么函数y=f(x)在点
微分是微小的增量,即无穷小量
3.2 微分与导数的关系
通常把自变量x的增量
所以导数也被称作“微商”。可以看如下图,应该更好理解。
4 泰勒公式
引用知乎上的一个回答,泰勒公式:就是用多项式函数去逼近光滑函数。
在计算机中,我们需要求比如
在近似计算中,可以有如下公式:
0 | 1 |
---|---|
|
|
|
|
|
|
5 方程近似解
5.1 二分法
设f(x)在区间[a, b]上连续,
如下图可以形象的表示出来,首先取[a1,b1],然后[a1,b2],接着[a2, b2], 接着[a3, b2],依次类推,慢慢接近f(x) = 0,最后求出近似解,这个和循环的次数相关。
5.2 牛顿法
首先,选择一个接近函数f(x)零点的x0,计算相应的f(x0)和切线斜率f’(x0)。然后我们计算穿过点(x0,f(x0))并且斜率为f’(x0)的直线和x轴的交点的x坐标,也就是求如下方程的解:
化简得到:
其实原理是利用泰勒公式, 在
可以观察如下图所示,首先是A点,求到B点,接着C点,依次类推,最后到f(x)=0,求出近似值。
6 积分
6.1 不定积分的定义
如果区间I上,可导函数F(x)的导函数为f(x),即对任一
那么函数F(x)就称为f(x)在区间I上的原函数。
不定积分可以记作:
6.2 常用不定积分
0 | |
---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
分部积分: |
分部积分: |
6.3 定积分
如下图所示:
7 偏导数
7.1 偏导数的定义
- 对于x的偏导
∂f∂x∣(x0,y0)=ddxf(x,y0)∣(x0,y0)=limh→0f(x0+h,y0)−f(x0,y0)h - 对于y的偏导
∂f∂y∣(x0,y0)=ddxf(x0,y)∣(x0,y0)=limh→0f(x,y0+h)−f(x0,y0)h
7.2 偏导数的几何意义
8 方向导数和梯度
8.1 方向导数定义
8.2 梯度向量(梯度)定义
方向导数是
由上式可知,因为
9 雅可比,海森矩阵
9.1 雅可比矩阵定义
雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近. 因此, 雅可比矩阵类似于多元函数的导数.
假设
此矩阵表示为:
雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近。因此,雅可比矩阵类似于多元函数的导数。雅可比矩阵定义为向量对向量的微分矩阵。
9.2 雅可比行列式
如果m = n, 那么
9.3 海森矩阵
在数学中, 海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵, 此函数如下:
如果
其中
可以参考下:Jacobian矩阵和Hessian矩阵
10 拉格朗日乘子法
10.1 定义
假设
对于两个变量的函数,适当的方程是
10.2 例子
设想我们的目标函数
11 最小二乘法
11.1定义
- 最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。—-来自百度百科
- 简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。
11.2 例子
设拟合直线是
令导数为0整理可得:
令
解得:
还有重积分,向量的导数等等知识点以后学到了再去看吧,突然发现大学的时候只记得公式,具体的为什么很多都不是很清楚,还有很多的几何意义也似懂非懂,慢慢再补吧,继续补下去感觉出不来了。接下来开始看线性代数吧。
附上: 希腊字母表(配读音)
序号 | 大写 | 小写 | English | 发音 | 中文 | 含义 |
---|---|---|---|---|---|---|
1 | Α | α | alpha | a:lf | 阿尔法 | |
2 | Β | β | beta | bet | 贝塔 | |
3 | Γ | γ | gamma | ga:m | 伽马 | |
4 | Δ | δ | delta | delt | 德尔塔 | δ: delta value,偏差值 |
5 | Ε | ε | epsilon | ep’silon | 伊普西龙 | |
6 | Ζ | ζ | zeta | zat | 截塔 | |
7 | Η | η | eta | eit | 艾塔 | |
8 | Θ | θ | thet | θit | 西塔 | |
9 | Ι | ι | iot | aiot | 约塔 | |
10 | Κ | κ | kappa | kap | 卡帕 | |
11 | ∧ | λ | lambda | lambd | 兰布达 | |
12 | Μ | μ | mu | mju | 缪 | |
13 | Ν | ν | nu | nju | 纽 | |
14 | Ξ | ξ | xi | ksi | 克西 | ξ: slack variable,松弛变量 |
15 | Ο | ο | omicron | omik’ron | 奥密克戎 | |
16 | ∏ | π | pi | pai | 派 | π: 圆周率 |
17 | Ρ | ρ | rho | rou | 肉 | |
18 | ∑ | σ | sigma | ‘sigma | 西格马 | |
19 | Τ | τ | tau | tau | 套 | |
20 | Υ | υ | upsilon | jup’silon | 宇普西龙 | |
21 | Φ | φ | phi | fai | 佛爱 | |
22 | Χ | χ | chi | phai | 凯 | |
23 | Ψ | ψ | psi | psai | 普西 | |
24 | Ω | ω | omega | o’miga | 欧米伽 |