【课堂笔记】定理：样本越多，测量的经验损失越接近真实损失-证明

令 $Z_i = l(f(x_i),y_i)$ ，其中 $(x_i,y_i) \in S_{test}$ ， $i=1,2,...,m,m=|S_{test}|$
由于 $(x_i,y_i) \sim \mathcal{D}$ ， $Z_i$ 是独立同分布的随机变量，且由假设， $Z_i \in [a,b]$ 。于是：

$\mathbb{E}[Z_i]=\mathbb{E}_{(x,y) \sim \mathcal{D}}[l(f(x),y)]=L_{\mathcal{D}}(f)$

经验分险为：

$L_{S_{test}}(f)=\frac{1}{m}\underset{i=1}{\overset{m}{\sum}}Z_i$

引入霍夫丁不等式，它表面对于 $m$ 个独立随机变量 $Z_1, ..., Z_m$ ，每个 $Z_i \in [a,b]$ ，有：

$\Pr\left[ \left| \frac{1}{m} \sum_{i=1}^m Z_i - \mathbb{E}[Z_i] \right| \geq \epsilon \right] \leq 2 \exp\left( -\frac{2m\epsilon^2}{(b - a)^2} \right)$

代入后则有：

$\Pr\left[ \left| L_{S_{\text{test}}}(f) - L_{\mathcal{D}}(f) \right| \geq \epsilon \right] \leq 2 \exp\left( -\frac{2m\epsilon^2}{(b - a)^2} \right)$

确定一个特定的 $\epsilon$ ，令：

$2exp(-\frac{2m\epsilon^2}{(b-a)^2})=\frac{\delta}{2}$
$\epsilon=\sqrt{\frac{(b-a)^2ln(2/\delta)}{2m}}=\sqrt{\frac{(b-a)^2ln(2/\delta)}{2|S_{test}|}}$

最终得到：

$\Pr\left[ \left| L_{\mathcal{D}}(f) - L_{S_{\text{test}}}(f) \right| \geq \sqrt{\frac{(b - a)^2 \ln(2/\delta)}{2 |S_{\text{test}}|}} \right] \leq \delta$

秒客网

【课堂笔记】定理：样本越多，测量的经验损失越接近真实损失-证明

相关文章