一、概念形式化
输入:x
输出:y
目标函数:F:x → y
数据:(x1, y1), (x2, y2), …, (xN, yN)
假设函数:g:x → y
假设集:H={h}, G∈H
(假设集有助于理解是否用这个算法及用这个算法之后效果怎样。)
(F函数是未知的,是机器学习的一个目标,运用数据和例子来做出假设,得到G函数。G值和F值是很接近的,但F是未知的,G是已知的。最终是希望G无限接近于F)
二、简单的机器学习过程
解决机器学习问题的两个组成成分:
1、假设集H
2、学习算法
以上两者相结合,就组成了一个机器学习的模型(感知器学习模型)。
机器学习的目的是找到一个最好的学习方法,这个方法可以最小化目标函数(类似于误差函数)。学习算法和假设集是我们学习的工具。 最终假设是要得到的结果。
三、机器学习的本质
1、存在一个模式\模型——例如:一个人评价电影的方法
2、不能用数学来确定它——无法写出某些数或多项式来评价它
3、有数据——从数据入手进行研究