文件名称:pytorch-rl:使用pytorch和visdom进行深度强化学习
文件大小:12.31MB
文件格式:ZIP
更新时间:2024-02-25 17:11:12
reinforcement-learning deep-learning deep-reinforcement-learning pytorch dqn
深度强化学习 火炬与视觉 训练有素的特工的样本测试(突破时使用DQN,乒乓球上使用A3C,CartPole上使用DoubleDQN,InvertedPendulum(MuJoCo)上使用连续A3C): 在Pong上训练A3C代理时具有16个学习者过程的示例在线绘图示例: 在CartPole上训练DQN代理时的示例日志记录(我们目前使用WARNING作为日志记录级别来摆脱来自visdom的INFO打印输出): [WARNING ] (MainProcess) < =================================== > [WARNING ] (MainProcess) b
【文件预览】:
pytorch-rl-master
----models()
--------.gitignore(71B)
----figs()
--------.gitignore(71B)
----plot_compare.sh(3KB)
----core()
--------models()
--------agent.py(6KB)
--------__init__.py(0B)
--------envs()
--------memory.py(4KB)
--------env.py(3KB)
--------agents()
--------model.py(2KB)
--------memories()
--------agent_single_process.py(2KB)
----main.py(805B)
----optims()
--------sharedAdam.py(2KB)
--------sharedRMSprop.py(2KB)
--------helpers.py(307B)
--------__init__.py(0B)
----logs()
--------.gitignore(71B)
----assets()
--------a3c_con.gif(1.17MB)
--------a3c_pong.png(127KB)
--------breakout.gif(6.12MB)
--------a3c_pong.gif(7.13MB)
--------cartpole.gif(603KB)
----plot.sh(2KB)
----imgs()
--------.gitignore(71B)
----LICENSE.md(1KB)
----.gitignore(124B)
----README.md(8KB)
----utils()
--------options.py(14KB)
--------distributions.py(1KB)
--------helpers.py(3KB)
--------__init__.py(0B)
--------factory.py(3KB)
--------init_weights.py(1KB)