记山世光老师的讲座—以计算机视觉为例的人工智能初探

时间:2024-04-12 08:45:32

引子 :

   今天去望江校区听了山世光老师的关于人工智能的讲座,觉得收获很大,我决定在博客上整理一下,也算是对讲座中内容的巩固。老师主要是针对人工智能小白开展的讲座,对于我这个对机器学习、深度学习怀有敬畏心的“小白”,可谓是很大的收获,而且在讲座结束后,老师和许多学长学姐之间的问答环节也让我知道了人外有人,天外有天,所以以后还是要好好学习!所以,那就进入正题吧!因为是给小白讲的,所以基本就是个大致概括,如果有错误的地方,希望大家或者“以后的自己”及时指正出来!谢谢你们!、

1.数字化(单机)——网络化(联网应用)——智能化(2025)


2.人工智能:

   指在计算机领域,人工智能是指对“智能代理”的研究。任何可以感知环境采取行动以最大可能达成其特定目标的任何设备都是智能代理


 3.子问题:

      知识表示、感知、自然语言处理、规划、社会智能、通用只能、创造力、运动和操作


4.人工智能发展的历史变革:

符号主义、Lighthill的报告、第二次AI热潮立中神经网络和专家系统、日本五代机计划失败、1997深蓝人机大战、2011年第三次热潮

记山世光老师的讲座—以计算机视觉为例的人工智能初探

5.AI = A+B+C:

      A(Algorithm):算法

       B(Bi-data):大数据

       C(Computing):算力


6.计算机视觉:

生物启示:从宏观到微观:

大脑—脑区—神经细胞互联 —单个神经细胞—生化翻译

1000亿量级神经细胞,高度互联

在我们的大脑里,光信号—电信号—图像

每个神经元:加权投票模型(!赞成 !反对 !弃权)

模式发现器(是否出现了自己感兴趣的模型)——边缘检测

       祖母细胞理论:特定神经元对特定物体具有反应

       featural hierarchy 层级感受眼理论: 

              简单细胞—复杂细胞—超复杂细胞—超超细胞

              边缘—角点—简单图案—复杂图案—部件—物体

记山世光老师的讲座—以计算机视觉为例的人工智能初探  记山世光老师的讲座—以计算机视觉为例的人工智能初探

7.深度学习模型:

一.单神经元计算模型:加权求和(卷积)+非线性**函数

      记山世光老师的讲座—以计算机视觉为例的人工智能初探

二.多个单神经元互联形成多层神经网络(多元神经网络)

记山世光老师的讲座—以计算机视觉为例的人工智能初探

三.卷积神经网络CNN(加权共享)

记山世光老师的讲座—以计算机视觉为例的人工智能初探

神经网络的演化,以CNN为例:

网络加深、从分类任务到检测任务、增强卷积模块功能、增加新的功能单元

8.深度神经网络的学习:

记山世光老师的讲座—以计算机视觉为例的人工智能初探

不断调整权重、使得最终目标Y符合X的函数

特别提醒:深度学习等神经网络技术是“非常非常粗”的类脑,所以准确的说法是:“脑启发”的方法,而不是类脑智能

9.两个概念的区分:

一、训练(学习):需要大量数据学习参数,需要前馈和反馈(BP算法)、极其耗时(几周)、GPU服务器

二、推理(inference):耗时短、CPU

10.解决了什么类型的问题

识别任务、监测任务、视频结构化技术(监控场景行人车辆的检测、属性与跟踪估计)、无人机视觉技术、手势识别技术、在VOC2012数据集上、看图写作、visual question answering、图形合成及其风格转换(举一反三)

记山世光老师的讲座—以计算机视觉为例的人工智能初探

记山世光老师的讲座—以计算机视觉为例的人工智能初探

11.人脸识别流程

记山世光老师的讲座—以计算机视觉为例的人工智能初探

记山世光老师的讲座—以计算机视觉为例的人工智能初探

记山世光老师的讲座—以计算机视觉为例的人工智能初探

记山世光老师的讲座—以计算机视觉为例的人工智能初探

由设计到学习的权重变化:由人为函数设计计算 到 纯粹由数据学习进行权数改变

总结:

1.          方法论:由人类专家知识驱动的AI方法论 到 有监督大数据的数据驱动的AI方法论——到知识和数据的联合驱动(展望)

2.          思想变迁:(1)从重算法到重数据     (2)解决非线性问题的方法

(3)人工编码知识到从数据中学习知识

(4)从分而治之到全盘考虑(子问题最优并非全局最优,不能一直使用贪心算法)

记山世光老师的讲座—以计算机视觉为例的人工智能初探

演讲后问题:

1.   人工智能、机器学习、深度学习的区别?

答:人工智能是最广泛的一个名词,其他所有研究都是人工智能的子学科,如Natural language processing、learning

   机器学习,需要通过数据完成机器的学习和对特定目标的求解

   深度学习,是机器学习的一个子项目,(比较火)从机器学习中单独列出,深度学习指的是多层的神经网络(至少超过三层)

2.   数据(80%)>网络结构(20%)