文件名称:Human-level control through deep reinforcement learning
文件大小:4.49MB
文件格式:PDF
更新时间:2022-01-09 12:19:55
深度学习
强化学习理论根植于心理学和神经科学,它可以很好的解释一个代理如何在一个环境中优化自己的控制。为了在真实复杂的物理世界中成功的使用强化学习算法,一个代理必须面对困难的任务:利用高维的传感器输入数据以达到很好的表达,并且泛化之前的经验到新的未见环境中。显然的,人类和其他动物可以通过协调的组合强化学习以及层次化的感知处理系统来很好的处理这个问题。前者已经被大量的神经数据所佐证,这些数据揭示了在多巴胺促使神经元激发的相位信号和短时差分强化学习算法的相似性。