dads:“动态感知的无监督技能发现”(DADS)的代码。 无需监督即可进行技能发现,可与基于模型的控制结合使用

时间:2021-04-14 08:38:03
【文件属性】:
文件名称:dads:“动态感知的无监督技能发现”(DADS)的代码。 无需监督即可进行技能发现,可与基于模型的控制结合使用
文件大小:72KB
文件格式:ZIP
更新时间:2021-04-14 08:38:03
reinforcement-learning deep-learning unsupervised-learning model-based-rl skill-discovery 动态感知技能发现(DADS) 该存储库是Dynamics-Aware无监督技能发现的开源实现(, )。 我们提出了一种技能发现方法,该方法可以学习不同特工的技能而无需任何奖励,同时可以学习技能动态模型,该模型可以用于对下游任务进行基于模型的控制。 这项工作发表在2020年国际学习代表大会( )上。 我们还包括改进的DADS脱离政策版本,即DADS之外的形式。 详细信息已在“发布。 如有问题,请联系Archit Sharma。 目录 设置 (1)设置MuJoCo 下载和安装在~/.mujoco 。 在~/.bashrc设置LD_LIBRARY_PATH : LD_LIBRARY_PATH='~/.mujoco/mjpro150/bin':$LD_LIBRARY_PATH (2)安装环境 克隆存储库并设置环境以运行DADS代码: cd conda
【文件预览】:
dads-master
----.gitignore(178B)
----env.yml(927B)
----README.md(5KB)
----configs()
--------ant_xy_offpolicy.txt(3KB)
--------dkitty_randomized_xy_offpolicy.txt(3KB)
--------humanoid_offpolicy.txt(3KB)
--------humanoid_onpolicy.txt(3KB)
--------template_config.txt(3KB)
--------ant_xy_onpolicy.txt(3KB)
----LICENSE(11KB)
----CONTRIBUTING.md(1KB)
----AUTHORS(131B)
----lib()
--------py_tf_policy.py(9KB)
--------py_uniform_replay_buffer.py(9KB)
----envs()
--------video_wrapper.py(2KB)
--------hand_block.py(3KB)
--------dclaw.py(7KB)
--------skill_wrapper.py(3KB)
--------dkitty_redesign.py(8KB)
--------gym_mujoco()
--------assets()
----unsupervised_skill_learning()
--------dads_agent.py(9KB)
--------dads_off.py(67KB)
--------skill_dynamics.py(15KB)
--------skill_discriminator.py(11KB)

网友评论