本文是将文章《近似线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。
公式 9-51 到 9-59 是在近似线性可分支持向量机(SVM)的优化过程中推导出来的 KKT(Karush-Kuhn-Tucker)条件。KKT 条件是求解带约束优化问题的必要条件,通过这些条件,我们可以找到支持向量机的最优解。接下来,我将详细解释这些公式及其作用。
背景
我们从原始问题的拉格朗日函数出发:
L
(
w
,
b
,
ξ
,
α
,
μ
)
=
1
2
∥
w
∥
2
+
C
∑
i
=
1
N
ξ
i
−
∑
i
=
1
N
α
i
(
y
i
(
w
T
x
i
+
b
)
−
(
1
−
ξ
i
)
)
−
∑
i
=
1
N
μ
i
ξ
i
L(w, b, \xi, \alpha, \mu) = \frac{1}{2} \|w\|^2 + C \sum_{i=1}^{N} \xi_i - \sum_{i=1}^{N} \alpha_i \left( y_i(w^T x_i + b) - (1 - \xi_i) \right) - \sum_{i=1}^{N} \mu_i \xi_i
L(w,b,ξ,α,μ)=21∥w∥2+Ci=1∑Nξi−i=1∑Nαi(yi(wTxi+b)−(1−ξi))−i=1∑Nμiξi
通过对拉格朗日函数对 w w w、 b b b、和 ξ i \xi_i ξi 求偏导数并设为 0,以及利用 KKT 条件,我们可以得到公式 9-51 到 9-59。
公式解释
公式 9-51
∂ L ∂ w = w − ∑ i = 1 N α i y i x i = 0 \frac{\partial L}{\partial w} = w - \sum_{i=1}^{N} \alpha_i y_i x_i = 0 ∂w∂L=w−i=1∑Nαiyixi=0
- 解释:对 L L L 关于 w w w 求偏导数并设为 0。
- 含义:该公式表明权重向量 w w w 可以表示为一系列样本点的线性组合。换句话说,最优的 w w w 是支持向量(即 α i > 0 \alpha_i > 0 αi>0 的点)乘以对应标签 y i y_i yi 和特征 x i x_i xi 的加权和。
-
解出:可以得到
w
w
w 的表达式:
w = ∑ i = 1 N α i y i x i w = \sum_{i=1}^{N} \alpha_i y_i x_i w=i=1∑Nαiyixi
公式 9-52
∂ L ∂ b = − ∑ i = 1 N α i y i = 0 \frac{\partial L}{\partial b} = -\sum_{i=1}^{N} \alpha_i y_i = 0 ∂b∂L=−i=1∑Nαiyi=0
- 解释:对 L L L 关于 b b b 求偏导数并设为 0。
- 含义:这个条件确保了所有支持向量的贡献在决策边界上是平衡的。
-
解出:可以得到如下约束:
∑ i = 1 N α i y i = 0 \sum_{i=1}^{N} \alpha_i y_i = 0 i=1∑Nαiyi=0
公式 9-53
∂ L ∂ ξ i = C − α i − μ i = 0 \frac{\partial L}{\partial \xi_i} = C - \alpha_i - \mu_i = 0 ∂ξi∂L=C−αi−μi=0
- 解释:对 L L L 关于 ξ i \xi_i ξi 求偏导数并设为 0。
- 含义:这个条件确保惩罚系数 C C C 与拉格朗日乘子 α i \alpha_i αi 和 μ i \mu_i μi 之间的关系。它表明每个样本的 ξ i \xi_i ξi 都要满足这个平衡条件。
-
解出:可以得到如下关系:
α i + μ i = C \alpha_i + \mu_i = C αi+μi=C
公式 9-54(互补松弛条件)
α i ( y i ( w T x i + b ) − 1 + ξ i ) = 0 \alpha_i \left( y_i(w^T x_i + b) - 1 + \xi_i \right) = 0 αi(yi(wTxi+b)−1+ξi)=0
- 解释:这是 KKT 条件中的互补松弛条件之一。
- 含义:如果 α i > 0 \alpha_i > 0 αi>0,那么 y i ( w T x i + b ) − 1 + ξ i = 0 y_i(w^T x_i + b) - 1 + \xi_i = 0 yi(wTxi