《机器学习导论》札记

时间:2022-04-03 21:26:18

《机器学习导论》 (土耳其)Ethem Alpaydin 著   范明等译。

 

1.1 什么是机器学习

1)机器学习方法在大型数据库中的应用称为数据挖掘(data mining)。数据挖掘也称数据库知识发现(knowledge discovery in databases,KDD)

 

1.2 机器学习的应用实例

 1.2.1 学习关联性  (条件概率)

 1.2.2 分类

       机器学习在模式识别(pattern recognition)方面有很多的应用。

  1)光学字符识别(optical character recognition, OCR),即字符图像识别字符编码。

  2)人脸识别(face recognition)

  3)医学诊断(medical diagnosis)

  4)语音识别(speech recognition)

  

 1.2.3 回归(regression)

   输出为数值的问题,为回归问题。

   回归和分类均为监督学习(supervised learning)问题。

 1.2.4 非监督学习

  在监督学习中,目标是学习从输入到输出的映射关系,其中输出的正确值已经由指导者提供。然而,非监督学习中却没有这样的指导者,只有输入数据。目标是发现输入数据中的规律。   输入空间中存在着某种结构,使得特定的模式比其他模式更常出现,而我们希望知道哪些经常发生,哪些不经常发生。在统计学中,这成为 密度估计(density estimation)。

    密度估计的一种方法是聚类(clustering),其目标是发现输入数据的簇或分组。