批量学习Batch Learning
在线学习Online Learning
批量学习:
收集样本送给我们的机器学习训练,就可以直接将模型投入到生产环境中
输入的样例不在座位学习资料优化模型了
批量学习:简单
问题:如何适应环境变化?
第二年垃圾邮件和第一年就会很大不同
不过变化速度比较慢,解决方案:定时重新批量学习
每次重新进行机器学习,运算量巨大, 有时候环境变化太快了,不可能
比如说股市,就是每时每分每秒都在不断变化的
如果需要我们的算法及时适应环境的变化,就要使用在线学习的方式
在线学习
我们预测下一分钟的股价,和正确的股价的差异
相当于在线不止得到我们想要的结果,还在不断地训练算法
优点:及时反映新的环境变化
问题:新的数据带来不好的变化?
比如我们的竞争对手用一些错误的方式,来误导我们的系统
结局方案:需要加强对数据的监控
其他:也适用于数据量巨大,完全无法批量学习的环境
参数学习和非参数学习
我们假设
f(x)=ax+b
想办法找到a和b
一旦学到了参数,就不需要原有的数据集
非参数学习:不对模型进行过多假设
注意!不代表没有参数