文件名称:过拟合的问题-贴片电子元件丝印查询(带完整目录)
文件大小:7.67MB
文件格式:PDF
更新时间:2024-06-30 14:44:14
机器学习
7.1 过拟合的问题 参考视频: 7 - 1 - The Problem of Overfitting (10 min).mkv 如果我们有非常多的特征,我们通过学习得到的假设可能能够非常好地适应训练集(代 价函数可能几乎为 0),但是可能会不能推广到新的数据。 下图是一个回归问题的例子: 第一个模型是一个线性模型,欠拟合,不能很好地适应我们的训练集;第三个模型是一 个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。我们可以看 出,若给出一个新的值使之预测,它将表现的很差,是过拟合,虽然能非常好地适应我们的 训练集但在新输入变量进行预测时可能会效果不好;而中间的模型似乎最合适。 分类问题中也存在这样的问题: 就以多项式理解,x 的次数越高,拟合的越好,但相应的预测的能力就可能变差。 问题是,如果我们发现了过拟合问题,应该如何处理?