一、什么是学习?
1、人类是如何学习?
人类从小一直在各种学习,从学习走路到学习说话等等。那我们具体时候怎么学习的呢?比如学习说话,我们会用耳朵去听别人说出来的声音以及嘴巴的嘴型变化,这些其实都可以看做是我们的观察,有了这些观察,我们才可以去模仿和纠正,直到我们学习成功为止。如下图所示:
2、机器是如何学习?
机器和人不一样的地方是数据获取和处理的方式不同。机器的“观察”其实就是获取到的数据,它的学习其实就是对这些数据进行计算,最终通过这些计算来获取一些我们想要的规律。如下图所示:
但是人类每次学习都能发现自己的不足,机器也可以吗?答案是可以的。上图的“skill” 可以定义为“可以度量的价值”,只要我们根据目标任务用公式定义了这个“skill”,而且每次往提升的方向走,这样就可以使机器拥有学习的能力。
二、什么是机器学习?
机器学习其实就是从数据的角度出发,让机器从数据中挖掘规律。因此其实应该叫“数据学习”可能更为贴切。
三、统计学习与机器学习的关系
上面提到机器学习是基于数据进行学习的,其中有一种就是基于概率统计模型对数据进行学习的,这一类方法就被称为“统计机器学习”(简称 “统计学习”)。
数据对象:包括文字、图像、视频、音频等等。
学习的大体思路:提取数据的特征->抽象数据模型->发现数据知识->对数据进行分析和预测
建模要点:使用随机变量描述数据中的特征,概率分布描述数据中的统计规律。
学习的具体步骤:
A、得到一个有限的训练数据集合。
B、确定包含所有可能的模型的假设空间,即学习模型的集合。
C、确定模型选择的准则,即学习的策略。
D、实现求解最优模型的算法,即学习的算法。
E、通过学习方法选择最优模型。
F、利用学习的最优模型对新数据进行预测或分析。
四、主要的机器学习方法