文件名称:DeepRL 使用PyTorch的高度模块化实现流行的深度RL算法-python
文件大小:819KB
文件格式:ZIP
更新时间:2024-07-08 12:47:52
机器学习
DeepRL 使用PyTorch的高度模块化实现流行的深度RL算法 DeepRL 如果您有任何问题或想报告错误,请打开一个问题,而不是直接给我发送电子邮件。 PyTorch 对流行的深度强化学习算法的模块化实现。 在玩具任务和具有挑战性的游戏之间轻松切换。 实现的算法:(双/决斗)深度Q-学习(DQN)分类DQN(C51,KL距离分布DQN)分位数回归DQN(连续/离散)同步优势Actor Critic(A2C)同步N步Q-学习深度确定性策略梯度 (DDPG) 近端策略优化 (PPO) Option-Critic Architecture (OC) Twined Delayed DDPG (TD3) COF-PAC/GradientDICE/Bi-Res-DDPG/DAC/Geoff-PAC/QUOTA/ACE 异步算法(例如, A3C) 可以在 v0.1 中找到。 动作条件视频预测可以在 v0.4 中找到。 Atari 游戏的同步 PPO 可以在 v1.1 Dependency MacOS 10.12 或 Ubuntu 16.04 PyTorch v1.4.0 Python
【文件预览】:
DeepRL-master
----docker_stop.sh(313B)
----examples.py(22KB)
----docker_batch.sh(634B)
----template_plot.py(3KB)
----images()
--------mujoco_eval.png(407KB)
--------Breakout.png(72KB)
--------PPO.png(311KB)
----Dockerfile(2KB)
----requirements.txt(204B)
----template_jobs.py(3KB)
----LICENSE(1KB)
----setup.py(650B)
----README.md(6KB)
----deep_rl()
--------utils()
--------component()
--------__init__.py(89B)
--------network()
--------agent()
----docker_build.sh(72B)
----docker_shell.sh(164B)
----docker_clean.sh(43B)
----.gitignore(1KB)
----docker_python.sh(227B)