active-domainrand:用于主动域随机化的代码库(CoRL 2019,https

时间:2024-06-19 03:57:45
【文件属性】:

文件名称:active-domainrand:用于主动域随机化的代码库(CoRL 2019,https

文件大小:4.83MB

文件格式:ZIP

更新时间:2024-06-19 03:57:45

Python

主动域随机化 (ADR) 是一种用于改进机器人强化学习策略的零样本转移的新方法。 基于对随机空间进行统一采样的传统域随机化,我们表明,用对困难 MDP 实例的主动搜索代替它可以提高结果策略的泛化性和鲁棒性。 下面是我们重现论文中实验的代码。 如果您对并行进行域随机化的简单方法感兴趣,请查看我们的存储库。 实验 基线实验 纯基线 这里最重要的标志是--initial-svpg-steps=1e6 ,这将确保在达到该步数限制之前只建议随机环境(它永远不会)。 环境名称 ( randomized-env-id ) 处理随机化范围 - LunarLanderDefault-v0具有单值范围,因此randomize()调用将始终产生相同的默认环境。 同样, LunarLanderRandomized-v0具有完整的随机化范围(在一维中)。 在命令行上,从[lunar|pusher|ergo]指定


网友评论