前言
接下来时间给大家系统讲讲,机器学习-深度学习–大数据分析相关知识,为了自己系统学习,同时也分享给大家一起学习!
主要内容
1.机器学习的种类
2.机器学习的任务分类
3.机器学习的方法
4.机器学习模型汇总
1.机器学习的种类
这里给大家介绍一下机器学习的种类,主要是根据处理的数据种类不同,可以把机器学习分为:
1.1 监督学习
1)官方解释
监督学习就是分类,通过已有的训练样本去训练得到一个最优模型,然后利用这个最优模型将所有输入映射为相应的输出,对于输出进行判断实现分类,这就对未知数据进行了分类。监督学习中的典型例子是KNN和SVM。
2)用一个通俗易懂解释:
是指有求知欲的学生从老师那里获取知识,信息,老师提供对错指示,告知答案的学习过程,在机器学习里,学生对应于计算机,老师则对应于周围的环境,老师则根据自身所获得经验,技能,对没有学习过的问题进行正确的判断.
3)运用领域
1.手写文字识别
2.声音处理
3.图像处理
4.垃圾软件分类与拦截
5.网页检索
6.基因诊断
7.股票预测领域
4)监督学习算法
k-近邻算法
线性回归
朴素贝叶斯算法
局部加权线性回归
支持向量机
Ridge回归
决策树
Lasso最小回归系数估计
无监督学习的用途
K-均值
最大期望算法
DBSCAN
Parzen窗设计
1.2 无监督学习
官方解释
无监督学习(unsupervised learning)就是指训练样本的标记(label)信息是未知的。
通俗一点解释:
还是拿教师的例子来讲,是指在没有老师的情况下,学生自主学习的过程,在机器学习里,基本都是计算机在互联网中自动收集信息,并从中获取有用的信息.
运用领域
1)人造卫星故障诊断
2)视频分析
3)社交网站解析
4)声音信号解析
5)数据可视化领域
主要算法
聚类
1.3 半监督学习
这里就不在讲了 ,是介于监督学习和半监督学习之间的一种学习方式.
1.4 强化学习
强化学习与之前说的监督学习是类似的,也以使计算机获得对对没有学习过的问题做出正确解答的范化能力为目标,但是在学习过程中,不设置老师提示的对错,告知最终答案的环节,如果真的在学习过程中不能从周围环境获得任何有用信息的话,此时的强化学习就变成了无监督学习了.
算法
1)回归
2)分类
3)聚类
4)降维技术
3.机器学习模型汇总
1)线性模型基本形式
给定一个d个属性的样本x=(x1;x2;…;xd) 其中 xi是在x中第i个属性的值。 线性模型就是试图寻找一个属性的线性组合来预测的函数:
f=w1x1+w2x2+……..+wdxd+b
用向量形式来表示就是: f=WTX+b ,W=(w1;w2;….;wd)
通过训练样本学习到两个参数,就得到了线性模型。线性模型的形式简单,易于建模,并且许多很多的非线性模型都可以在线性模型的基础上进行层级结构或者高位映射得到, 这就扩大了线性模型的可用范围。接下来介绍几种经典的线性模型。
2)核模型
核模型,是以使用被称为核函数的二元函数 κ(⋅,⋅),以K(x,xj) (j=1,…,n)的线性结合方式加以定义的。后面详细讲解.
3)层级模型