rapid:[ICLR 2021]对情节进行排名

时间:2024-06-15 03:03:21
【文件属性】:

文件名称:rapid:[ICLR 2021]对情节进行排名

文件大小:1.23MB

文件格式:ZIP

更新时间:2024-06-15 03:03:21

Python

[ICLR 2021] RAPID:强化学习探索的简单方法 这是ICLR 2021论文的Tensorflow实现,。 我们提出了一种简单的方法RAPID,用于通过模仿前几集并通过模仿学习来再现良好的探索行为来进行探索。 该实现基于。 对于所有实验,请添加--disable_rapid选项以查看基线结果。 与上的最新探索方法相比,RAPID可以实现更好的性能和采样效率。 引用这项工作 @inproceedings{ zha2021rank, title={Rank the Episodes: A Simple Approach for Exploration in Procedurally-Generated Environments}, author={Daochen Zha and Wenye Ma and Lei Yuan and Xia Hu and Ji Liu}, book


【文件预览】:
rapid-main
----setup.py(730B)
----.gitignore(2KB)
----requirements.txt(109B)
----LICENSE(1KB)
----README.md(4KB)
----imgs()
--------overview.png(396KB)
--------performance.png(672KB)
--------rendering.png(357KB)
----rapid()
--------buffer.py(5KB)
--------mujoco_envs()
--------__init__.py(979B)
--------agent.py(14KB)
--------utils.py(3KB)
--------maze.py(3KB)
--------train.py(1KB)
----main.py(2KB)

网友评论