《加州理工学院公开课：机器学习与数据挖掘》第1讲学习笔记

机器学习的定义（来源互联网，非本课程）：

《加州理工学院公开课：机器学习与数据挖掘》第1讲学习笔记
Performance Measure（性能测量）

机器学习的实质（什么时候可以使用机器学习）：

1.pattern exist；
2.不能用精确的数据公示表示；
3.data！

学习的组成部分(Component of Learning)：

《加州理工学院公开课：机器学习与数据挖掘》第1讲学习笔记
这是机器学习的一般过程，我们的关键就是确定这个假设集（hypothesis set）和学习算法（learning algorithm）。具体的形式化定义见下：

输入，输出，目标函数，数据集，为了得到假设g，使其结果能近似等于目标函数的结果。
《加州理工学院公开课：机器学习与数据挖掘》第1讲学习笔记

一个简单的模型：

教授举了一个例子，是PLA（perception learning algorithm，感知机学习算法）。
是以一个银行发放信贷的实际问题引入的。下面是用数学公式描述基本的模式（pattern）
《加州理工学院公开课：机器学习与数据挖掘》第1讲学习笔记
对公式进行化简表达方式：

得到简洁的公式后，下面是具体的学习算法PLA：

主要就是选择misclassified点，使用更新的权值向量，重新对算法进行迭代：

多次迭代后得到结果。
因为这里的数据集是线性可分的，因此算法是可以收敛的，能够获得正确的结果。

学习的种类：

监督学习（Supervised Learning）
无监督学习（Unsupervised Learning）
强化学习（Reinforcement Learning）：强化学习除了有输入和部分输出外，还有对输出的评分（评级）（grade for this output）（个人理解这是一个反馈，可以帮助机器学习改善学习结果，一步一步达到最优）。

最后附一些有用的链接：

Coursera台大机器学习课程的学习笔记，和本讲的内容非常相似：http://www.cnblogs.com/HappyAngel/p/3456762.html

另一个关于机器学习课程的博客：http://www.jianshu.com/p/3d316f380041

加州理工这门课程的网址，可以下载PPT等：http://work.caltech.edu/telecourse.html

秒客网