dads:“动态感知的无监督技能发现”（DADS）的代码。无需监督即可进行技能发现，可与基于模型的控制结合使用下载

【文件属性】：

文件名称：dads:“动态感知的无监督技能发现”（DADS）的代码。无需监督即可进行技能发现，可与基于模型的控制结合使用

文件大小：72KB

文件格式：ZIP

更新时间：2024-05-04 02:24:43

reinforcement-learning deep-learning unsupervised-learning model-based-rl skill-discovery

动态感知技能发现（DADS）该存储库是Dynamics-Aware无监督技能发现的开源实现（，）。我们提出了一种技能发现方法，该方法可以学习不同特工的技能而无需任何奖励，同时可以学习技能动态模型，该模型可以用于对下游任务进行基于模型的控制。这项工作发表在2020年国际学习代表大会（）上。我们还包括改进的DADS脱离政策版本，即DADS之外的形式。详细信息已在“发布。如有问题，请联系Archit Sharma。目录设置（1）设置MuJoCo 下载和安装在~/.mujoco 。在~/.bashrc设置LD_LIBRARY_PATH ： LD_LIBRARY_PATH='~/.mujoco/mjpro150/bin':$LD_LIBRARY_PATH （2）安装环境克隆存储库并设置环境以运行DADS代码： cd conda

立即下载

【文件预览】：
dads-master
----.gitignore(178B)
----env.yml(927B)
----README.md(5KB)
----configs()
--------ant_xy_offpolicy.txt(3KB)
--------dkitty_randomized_xy_offpolicy.txt(3KB)
--------humanoid_offpolicy.txt(3KB)
--------humanoid_onpolicy.txt(3KB)
--------template_config.txt(3KB)
--------ant_xy_onpolicy.txt(3KB)
----LICENSE(11KB)
----CONTRIBUTING.md(1KB)
----AUTHORS(131B)
----lib()
--------py_tf_policy.py(9KB)
--------py_uniform_replay_buffer.py(9KB)
----envs()
--------video_wrapper.py(2KB)
--------hand_block.py(3KB)
--------dclaw.py(7KB)
--------skill_wrapper.py(3KB)
--------dkitty_redesign.py(8KB)
--------gym_mujoco()
--------assets()
----unsupervised_skill_learning()
--------dads_agent.py(9KB)
--------dads_off.py(67KB)
--------skill_dynamics.py(15KB)
--------skill_discriminator.py(11KB)

秒客网

dads:“动态感知的无监督技能发现”（DADS）的代码。无需监督即可进行技能发现，可与基于模型的控制结合使用

网友评论

相关文章

dads:“动态感知的无监督技能发现”（DADS）的代码。 无需监督即可进行技能发现，可与基于模型的控制结合使用

网友评论

相关文章

dads:“动态感知的无监督技能发现”（DADS）的代码。无需监督即可进行技能发现，可与基于模型的控制结合使用