文件名称:DeepQLearning:深度思想论文的实现
文件大小:254KB
文件格式:ZIP
更新时间:2024-05-31 05:45:10
JupyterNotebook
深度学习 实施深度思想的论文,题目为“通过深度强化学习进行人的水平控制”。 策略梯度算法也已在Cart Pole上实施和测试,仅用于实验。 要求 的Python 3.6.1 张量流 健身房 麻木 斯克莱恩 matplotlib 训练模型 对于DQN python main.py当提示您选择训练,播放或可视化类型“火车”时 对于策略渐变python policy_gradients.py当提示您选择训练或播放类型“训练”时 测试模型 对于DQN python main.py当提示您选择训练,播放或可视化时,键入“播放” 对于策略渐变python policy_gradients.py当提示您选择训练或播放类型“播放”时 结果 游戏 最高分 爆发 45 车杆 200 爆发 卡特波尔 实验 爆发 卡特波尔
【文件预览】:
DeepQLearning-master
----images()
--------pg.JPG(22KB)
--------breakout.gif(169KB)
--------cartpole.gif(72KB)
--------dqn.JPG(17KB)
----prep_vis.py(3KB)
----README.md(1KB)
----policy_gradients.py(4KB)
----main.py(2KB)
----DeepQLearning.ipynb(31KB)
----dql.py(4KB)
----model.py(3KB)