《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记

时间:2021-11-27 01:20:39

机器学习的定义(来源互联网,非本课程):

《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
Performance Measure(性能测量)

机器学习的实质(什么时候可以使用机器学习):

1.pattern exist;
2.不能用精确的数据公示表示;
3.data!

学习的组成部分(Component of Learning):

《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
这是机器学习的一般过程,我们的关键就是确定这个假设集(hypothesis set)和学习算法(learning algorithm)。具体的形式化定义见下:
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
输入,输出,目标函数,数据集,为了得到假设g,使其结果能近似等于目标函数的结果。
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记

一个简单的模型:

教授举了一个例子,是PLA(perception learning algorithm,感知机学习算法)。
是以一个银行发放信贷的实际问题引入的。下面是用数学公式描述基本的模式(pattern)
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
对公式进行化简表达方式:
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
得到简洁的公式后,下面是具体的学习算法PLA:
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
主要就是选择misclassified点,使用更新的权值向量,重新对算法进行迭代:
《加州理工学院公开课:机器学习与数据挖掘》第1讲学习笔记
多次迭代后得到结果。
因为这里的数据集是线性可分的,因此算法是可以收敛的,能够获得正确的结果。

学习的种类:

  1. 监督学习(Supervised Learning)
  2. 无监督学习(Unsupervised Learning)
  3. 强化学习(Reinforcement Learning):强化学习除了有输入和部分输出外,还有对输出的评分(评级)(grade for this output)(个人理解这是一个反馈,可以帮助机器学习改善学习结果,一步一步达到最优)。

最后附一些有用的链接:

  1. Coursera台大机器学习课程的学习笔记,和本讲的内容非常相似:http://www.cnblogs.com/HappyAngel/p/3456762.html
  2. 另一个关于机器学习课程的博客:http://www.jianshu.com/p/3d316f380041
  3. 加州理工这门课程的网址,可以下载PPT等:http://work.caltech.edu/telecourse.html