DeepRL:PyTorch中的深度RL算法的模块化实现

时间:2024-06-13 17:20:09
【文件属性】:

文件名称:DeepRL:PyTorch中的深度RL算法的模块化实现

文件大小:819KB

文件格式:ZIP

更新时间:2024-06-13 17:20:09

deep-reinforcement-learning rainbow pytorch dqn ddpg

DeepRL 如果您有任何疑问或想要报告错误,请打开一个问题,而不是直接通过电子邮件发送给我。 PyTorch中流行的深度RL算法的模块化实现。 在玩具任务和具有挑战性的游戏之间轻松切换。 实现的算法: (双重/决斗/优先)深度Q学习(DQN) 分类DQN(C51) 分位数回归DQN(QR-DQN) (连续/离散)同步优势演员评论家(A2C) 同步N步Q学习(N步DQN) 深度确定性策略梯度(DDPG) 近端政策优化(PPO) 选择关键体系结构(OC) 孪生延迟DDPG(TD3) DQN代理以及C51和QR-DQN具有用于生成数据的异步角色和用于将数据传输到GPU的异步重播缓冲区。 使用1个RTX 2080 Ti和3个线程,DQN代理可以在6小时内运行10M步(40M帧,更新2.5M梯度)以实现Breakout。 相依性 PyTorch v1.5.1 有关更多详


【文件预览】:
DeepRL-master
----setup.py(650B)
----docker_python.sh(227B)
----.gitignore(1KB)
----Dockerfile(2KB)
----images()
--------Breakout.png(72KB)
--------PPO.png(311KB)
--------mujoco_eval.png(407KB)
----requirements.txt(204B)
----docker_stop.sh(313B)
----LICENSE(1KB)
----examples.py(22KB)
----deep_rl()
--------component()
--------__init__.py(89B)
--------utils()
--------network()
--------agent()
----template_jobs.py(3KB)
----docker_clean.sh(43B)
----README.md(6KB)
----docker_shell.sh(164B)
----template_plot.py(3KB)
----docker_batch.sh(634B)
----docker_build.sh(72B)

网友评论