深度学习概述深度学习知识结构介绍

时间:2020-12-10 11:19:42
本系列基本内容:
1. 深度学习知识结构图
2. 追本溯源:深度学习基础
3. 什么正在发生?
4. 一个深度学习开发实例的分析

目的:1.了解深度学习发展
           2. 串联深度学习基本概念
           3. 掌握深度学习模型设计基本思想

一、深度学习知识结构图
深度学习概述深度学习知识结构介绍

首先我们以线性回归和神经网络为出发点,因为它们是整个深度学习的数据基础。

    1、 线性回归是根据数据拟合一个线性模型的过程,即 利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一。拟合目标的方法有很多种,主要使用的是梯度下降的方式。线性回归主要是解决数据呈线性分布时的预测问题,如天气,空气湿度等来推测未来的趋势,但很多情况下使用线性回归来预测的效果是不理想的,因此我们需要加入一些非线性的激励(通过引入非线性的方程使得模型拟合时具有非线性的能力)。

    2、线性模型通过非线性的激励可以形成 神经网络 。因此如果是非线性的问题,那么用神经网络模型可以更好的解决。神经网络的基本单位是神经元,这些神经元实际上是一些小的线性模型加上非线性激励的过程。

    传统的神经网络在时间和空间上进行扩展得到了CNN和RNN。
    其中 CNN叫做卷积神经网络,神经网络的神经元在计算时使用二维的卷积和的方式进行,使得运算在二维空间上进行扩展。而递归神经网络则是在时间上进行扩展。
     RNN叫做递归神经网络,和CNN相比,递归神经网络是在时间上进行扩展,即考虑当前问题的同时也要考虑上一个状态的结果作为当前状态的输入。因此是传统神经网络在时间上的扩展得到的。
    因为RNN只考虑上一个状态,而 LSTM( Long Short-Term Memory )改进,它不仅考虑上一个计算状态,还会考虑很久之前的状态。
    在此基础上,我们就可以据此完成很多任务。
    其中CNN的应用相对来说更加广泛,大多数用与图像的处理。
    1) 目标分类, CNN通过训练后就可以得到用于目标分类基本模型,在这个模型的基础上通过迁移学习可以用于不同的具体目的的事件,包括人脸识别,物品识别,场景识别,文字识别等等。
    2) 目标检测,通过图片找到目标(人/物)的具体位置。应用场景:安防,自动驾驶。
    
    而RNN由于它是在时域上的扩展,如果数据带有时间的属性,那么使用RNN的效果非常好,比如说话时词语之间前后时间关系的相互依赖。因此它的直接应用就是NLP-自然语言处理。

    总结:CNN-用于图像处理,RNN用于语音处理。
    而对于有些任务既有空间方面的信息又有时间方面的信息,因此可以将二者结合起来。如视频分类(既想知道根据图片得到信息,又想知道图片与图片之间的依赖关系),可以通过CNN提取特征作为LSTM的输入得到一个模型,或者使用LSTM做一个特征提取的工具,将feature提取出来作为CNN的输入让CNN来处理。
    
CNN的其他应用:
    1) CNN还可以用于生成 对抗网络,即,CNN是可以用于识别一个图片是什么,现在,我们使用CNN去生成一个图片,然后用CNN判别网络去判断之前生成的图片是不是对的,这两个任务进行一个对抗,慢慢的,生成网络所产生的图片越来越正确,判别网络判别的效果越来越准确。
    2) 增强学习。
    以上就是对整个深度学习知识体系的概要介绍。