机器学习的定义(来源互联网,非本课程):
Performance Measure(性能测量)
机器学习的实质(什么时候可以使用机器学习):
1.pattern exist;
2.不能用精确的数据公示表示;
3.data!
学习的组成部分(Component of Learning):
这是机器学习的一般过程,我们的关键就是确定这个假设集(hypothesis set)和学习算法(learning algorithm)。具体的形式化定义见下:
输入,输出,目标函数,数据集,为了得到假设g,使其结果能近似等于目标函数的结果。
一个简单的模型:
教授举了一个例子,是PLA(perception learning algorithm,感知机学习算法)。
是以一个银行发放信贷的实际问题引入的。下面是用数学公式描述基本的模式(pattern)
对公式进行化简表达方式:
得到简洁的公式后,下面是具体的学习算法PLA:
主要就是选择misclassified点,使用更新的权值向量,重新对算法进行迭代:
多次迭代后得到结果。
因为这里的数据集是线性可分的,因此算法是可以收敛的,能够获得正确的结果。
学习的种类:
- 监督学习(Supervised Learning)
- 无监督学习(Unsupervised Learning)
- 强化学习(Reinforcement Learning):强化学习除了有输入和部分输出外,还有对输出的评分(评级)(grade for this output)(个人理解这是一个反馈,可以帮助机器学习改善学习结果,一步一步达到最优)。
最后附一些有用的链接:
- Coursera台大机器学习课程的学习笔记,和本讲的内容非常相似:http://www.cnblogs.com/HappyAngel/p/3456762.html
- 另一个关于机器学习课程的博客:http://www.jianshu.com/p/3d316f380041
- 加州理工这门课程的网址,可以下载PPT等:http://work.caltech.edu/telecourse.html