AI 初学者入门指南:深度学习的五级分类

时间:2021-07-05 06:06:50

http://www.leiphone.com/news/201612/YbxNhoZ7z07SEpxr.html

编者按:目前 AI 被笼统划分为“弱人工智能”、“强人工智能”、“超人工智能”三个类别。甚至在很多业内专家(比如洪小文)眼中,只有“强”、“弱”AI 的区别,因为“超人工智能”离我们实在还很远,难以捉摸。这样的笼统分类显然不利于大众对于各项 AI 技术进行认识和理解。因此,一些专家开始提出基于技术难度和 AI 智能水平的分类、分级方法。其中,美国学者 Arend Hintze 提出了对 AI 的四级分类, 而最近,Intuition Machine 联合创始人 Carlos Perez 又提出了针对深度学习的五级分类。这些分类方法对各层次 AI 技术进行了简单的归类,有助于初学者更好地认识 AI 。

上个月,密歇根州立大学副教授 Arend Hintze 发表了一篇很有价值的短文章《理解 AI 的四种类别:从响应式机器到有自我意识的存在》( “Understanding the four types of AI, from reactive robots to self-aware beings” )。文中,他提出了对 AI 的四级分类:

  • 响应式

这是最基本的 AI 类型,无法产生记忆,不能利用过去的经验做决策。它们是“专才”而非“通才”,为完成特定任务所设计,不能胜任其他任务。

  • 有限记忆

当前行为能够参考刚刚发生的事件。但记忆是瞬时的——无法用于未来决策。

  • 心智理论( Theory of mind)

这是一个心理学术语,意思是能根据他人行为,推导、并理解他们的想法和动机。这一类型的  AI 能够归纳出周围环境、和与之交互的其他代理的“表征”( representations,AI 术语,详见“表示学习”)。

  • 自我意识

AI 的终极课题。目前对于它的描述大都是猜想。

对此,AI 专家 Carlos Perez 表示,他喜欢这个四分类法远远超过目前广泛使用的“强人工智能 vs 弱人工智能”二分类法(ps:或者再加上“超人工智能”成为第三个类别)。Arend Hintze 的方法把弱 AI 分为三个类别(响应式,有限记忆,心智理论),这给了我们更多概念,来区分不同的 AI 应用。但 Carlos Perez 又评论道,该分类法似乎来自于 “GOFAI” 思路(老式 AI),潜台词是它已经过时了;另外,从有限记忆、能够使用部分过去记忆做决策到心智理论,这步子迈得太大了。

于是,Carlos Perez  提出了他自己的 AI 分类方式,按能力把 AI 划分为五个级别。他表示,该分类法主要针对深度学习,希望对 AI 从业者来说更细致、更有用。它能帮我们看清楚 AI 目前在哪个阶段,以及将来会走向何方。

Perez 表示:“对当前 AI 技术进行评估,我们缺少一个好的概念框架。这可能只是由于大多数 AI 评论人无法跟上最新的深度学习进展——需要读的东西太多,而且最新发现不停刷新我们现在对 AI 的理解。”

我们来看看 Perez 针对深度学习能力的 AI 分类:

1. 只能分类的系统(ANNs/DL) Classification Only

该级别包含全连接神经网络( fully connected neural network ,FCN),卷积神经网络(convolution network,CNN)和它们之间的各种组合。这些系统把一个高维度矢量作为输入,得到单个结果,一般是对输入矢量的分类。

你可以把这些系统看成无状态函数,意味着它们的行为只是一个针对当前输入的函数。一个热门研究领域——生成模型,就属于该类别。简单来讲,这些系统凭它们自己是十分强大的。

2. 使用记忆分类的系统 Classification with Memory (CM)

这个级别包含 “C 层”网络中整合的记忆因素。LSTM 就是一个例子:记忆单位嵌入在 LSTM 节点中。其它类似的变形还有,神经图灵机器 (NMT) 和 DeepMind 的可微分神经计算机(DNC)。在对行为进行计算时,这些系统会维持状态恒定。

3. 使用知识分类的系统 Classification with Knowledge (CK)

该级别与 CM 有些相似。但 C 层网络能获取的信息不是原始内存,而是符号化的知识库(symbolic knowledge base)。雷锋网获知,事实上 Carlos Perez 就发现了三种符号化整合:1. 转移学习方式( transfer learning approach);2. 自上而下方式 ;3. 自下而上方式。第一种方式用一个符号化系统作为正则化矩阵(regularizer)。第二种方式在神经表征底层的最上层加入了符号化元素。第三种方式跟这相反,C 层网络直接与符号化知识库关联。

4. 使用有限知识的分类 Classification with Imperfect Knowledge (CIK)

在这个级别,系统直接建立在 CK 之上,但是,它已能够使用不完美的信息做推理。这类系统的代表是 Alpha Go。只是 Alpha Go 采用的不是 CK 而是 CM 级别的能力。正如 Alpha Go,这类系统能通过与自身的对抗模拟来训练自己。

5. 能使用有限知识协作分类的系统 Collaborative Classification with Imperfect Knowledge (CCIK)

这个级别和 Arend Hintze 的“心智理论”类别十分近似,多个代理神经网络联合起来解决问题。这些系统被设计来完成多项目标。我们其实可以在对抗网络中运行它的原始版本:与判别器和生成网络一起学习归纳。在博弈论驱动的、能战略战术性解决多重问题的网络上应用该概念,就能得到高度灵活的系统。但是,我们现在还达不到这个水平,前面那些级别仍需要很多研究来完善。

Perez 五级分类法的根据:

每一层级别,都带来了上个级别没有的新能力。 比方说,C 层系统只能预测反因果关系(anti-causal relationships)。 CM 级别的系统能完成不错的翻译。CIK 级别系统能玩战略游戏。

我们可以看出,除了没有“自我意识”级别,这个分类法和 Hinzte 四级分类高度相似。在这些“基础”级别全部达到之前,Carlos Perez 不准备探讨自我意识。这个分类同样没有提到零样本学习(zero-shot learning)、一步学习(one-shot learning)或者无监督学习。据雷锋网所知,后者仍然是 AI 基础挑战之一。正如 大牛 Yann LeCun 所形容:

“假设机器学习是一个蛋糕,强化学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖衣,无监督学习则是蛋糕糕体。我们知道怎么做糖衣和樱桃,但不知道怎么把糕体做出来。”

在最近的演讲里,Yann LeCun 开始用预测学习(predictive learning)来替代无监督学习。这是一个很有意思的转变:它展示出 LeCun 在如何做蛋糕这个问题上,观点发生了微妙变化。在他眼里,这是 AI 技术大幅进步所必需的基础。换句话说,在建设好预测学习的地基之前,在现有监督学习的基础上加入更多记忆、知识库、协作代理这些能力会十分困难。

雷锋网(公众号:雷锋网)获知,在最近的 NIPS 2016 大会上,LeCun 展示了这幅 PPT:

AI 初学者入门指南:深度学习的五级分类

这列出了 AI 进步的主要障碍:

  • 机器需要学习世界运作的方式

  • AI 要学习海量背景知识

  • 机器需要能够感知环境的状况

  • 机器需要更新并记忆环境的状况

  • 机器需要学习和计划

  • 智能和常识等于:感知+预测模型+记忆+推理和计划

这些能力在反馈回路里用到时,都利用了加速器技术。我们其实在现在的研究中看到过这类元学习(meta-learning)或是学习优化(learning to optimize)。元学习技术带来的主要启示是:当我们能训练机器找出用其它方法找不出的解决方案,研究方法会变得更强大。