Lecture 1: The Learning Problem(学习问题)

时间:2023-01-31 16:13:17

Lecture 1: The Learning Problem(学习问题)

1.1 CourseIntroduction(课程介绍)

 1.2WhatIs Machine Learning(什么是机器学习)

  学习与机器学习:

    学习:观察 -> 学习 -> 得到技能

   机器学习:数据 -> 机器学习 -> 得到技能

 

  从上述对比之中就大致可以知道什么是机器学习。学习,是通过观察、思考然后获得目标的技巧。而机器学习,则可以从学习的定义推出,机器学习,是利用已经知道的数据,找出一定的算法,从而得到目标技能。

  既然人可以通过观察得到技巧,而且很多的东西我们可以写成程序,然后让机器自己运转,那为什么我们还要机器学习呢?

  原因有二:

  1. 人虽然可以通过观察得到技巧,但是有些数据或者信息,人无法获取,可能是一些人无法识别的事物,也可能是数据过大,人工难以处理。人的处理有时候也无法满足需求,在短时间内处理大量数据是人类不能与机器相比的。

  2. 我们可以写出大量程序,让机器代替人快速解决问题。然而,有许许多多的东西我们是没有办法写出程序的。机器学习的两张王牌,预测(prediction)和识别(recognition)是没有可能可以写出程序来的。

  使用机器学习三要素:

  1.      存在一个模式或者说表现可以让我们对它进行改进提高

  2.      规则并不容易那么定义

  3.      有数据

 

  1.3 Applicationof Machine Learning(机器学习的应用)

  机器学习的运用是很广泛的,识别一棵树、一段话都是常见的应用。除了语音以及画面上的识别之外,机器学习也可以用作预测,预测股票走向,预测市场好坏,预测许许多多我们想要知道的东西。衣食住行,机器学习正在逐渐占领我们的生活。

  1.4 Componentof Machine Learning(机器学习的组成部分)

   这是第一章的重点

   介绍机器学习的理论符号和数学知识。

  e.g. 银行是否会给申请者发放信用卡

  1.输入(input):x∈X(每一个X中的x指银行记录里的用户信息)

  2.输出(output):y∈Y(是否会发信用卡给申请者)

  3.目标函数(target function):f:X -> Y(理想的信用卡公式)

  4.数据(data),即训练样本(training function):D={(x1 ,y1)…(xn,yn )}(银行的历史记录)

  5.假设(hypothesis):g: X -> Y(能够学习到的公式)

 

简单流程图:f 中的{(xn, yn )} -> 机器学习 -> g

  机器学习,就是从我们未知、但确实存在的公式f中得到数据(即训练样本),在这些数据的基础上得到一个近似于未知公式f的公式g。

 

详细的机器学习流程图:

                                  Lecture 1: The Learning Problem(学习问题)

 

注1:

 A:机器学习算法(learningalgorithm)

 H:假设空间或者叫做假设集合(hypothesis set)

 输入:训练样本集D、假设集合H

 输出:最终假设g≈f。

注2:

 A从H中挑选出它认为最好的假设作为g。

 机器学习就是通过数据来得到一个假设g,假设g近似于未知的目标函数f。

 

  1.5 MachineLearning and Other Field(机器学习与其他领域的关系)

   1.5.1       ML VS DM(DataMining 数据挖掘)

   数据挖掘是从大量的数据里找出有用的信息。机器学习是数据挖掘的一种重要的工具。找出的有用信息就是我们的目标函数的假设。

        

   1.5.2       ML VS AI(Artificial Intelligence 人工智能)

   人工智能是使得电脑表现出人类的智慧行为。机器学习是实现人工智能的一种方法。

 

   1.5.3       ML VS statistic(统计)

   统计是利用数据,对未知的东西进行推论。统计是实现机器学习的方法。