文件名称:元学习的好奇心算法(Meta-learning curiosity algorithms).pdf
文件大小:2.38MB
文件格式:PDF
更新时间:2023-04-03 12:28:00
元学习的好奇心算法
我们假设好奇心是进化过程中发现的一种机制,它鼓励个体在生命早期进行有意义的探索,从而使个体接触到能够在其一生中获得高回报的经历。我们将产生好奇行为的问题表述为元学习的问题之一:一个外环将在一个好奇心机制的空间中搜索,该机制动态地适应代理的奖励信号,而一个内环将使用适应的奖励信号执行标准的强化学习。