【机器学习】加州理工学院公开课——机器学习与数据挖掘 1.学习问题

时间:2021-12-22 01:48:11

一、概念形式化

输入:x

输出:y

目标函数:F:x → y

数据:(x1, y1), (x2, y2), …, (xN, yN)

假设函数:g:x → y

假设集:H={h},   G∈H

(假设集有助于理解是否用这个算法及用这个算法之后效果怎样。)

(F函数是未知的,是机器学习的一个目标,运用数据和例子来做出假设,得到G函数。G值和F值是很接近的,但F是未知的,G是已知的。最终是希望G无限接近于F)

二、简单的机器学习过程

      【机器学习】加州理工学院公开课——机器学习与数据挖掘  1.学习问题

     

       解决机器学习问题的两个组成成分:

       1、假设集H

       2、学习算法

       以上两者相结合,就组成了一个机器学习的模型(感知器学习模型)。

     机器学习的目的是找到一个最好的学习方法,这个方法可以最小化目标函数(类似于误差函数)。学习算法和假设集是我们学习的工具。 最终假设是要得到的结果。

三、机器学习的本质

1、存在一个模式\模型——例如:一个人评价电影的方法

2、不能用数学来确定它——无法写出某些数或多项式来评价它

3、有数据——从数据入手进行研究