文件名称:论文笔记—learning invariant feature spaces to transfer skills with RL
文件大小:1.03MB
文件格式:PDF
更新时间:2023-08-11 04:43:15
强化学习 迁移学习 模仿学习 机器人控制
论文摘要:人们可以根据自己的经验学习各种各样的任务,但也可以通过观察其他生物来学习。即使观察到的代理与学习代理形态之间的差异很大,也可以加快新技能的获取。在本文中,我们研究了强化学习算法如何在形态不同的代理(例如,不同的机器人)之间传递知识。我们介绍了一个问题提法,其中两个特工被要求通过共享信息来学习多种技能。我们的方法使用了两个代理所学到的技能来训练不变特征空间,然后将其用于将其他技能从一个代理转移到另一个代理。学习这些不变特征空间的过程可以看作是一种“类比制作”,或者是隐式学习两个不同领域之间的部分对应关系。我们用两种模拟的机器人操作技能评估了转移学习算法,并说明了我们可以在具有不同链接数的模拟机器人臂之间以及在具有不同致动机制的模拟臂之间转移知识,其中一个机器人是扭矩驱动的,而另一机器人是腱驱动的。