deep_rl_pong_keras:深度强化学习策略梯度方法-乒乓球游戏-Keras

时间:2024-06-01 22:04:29
【文件属性】:

文件名称:deep_rl_pong_keras:深度强化学习策略梯度方法-乒乓球游戏-Keras

文件大小:9.8MB

文件格式:ZIP

更新时间:2024-06-01 22:04:29

tutorial reinforcement-learning ai guide keras

深度强化学习指南(与Keras和OpenAi体育馆一起使用) 使用Keras和OpenAi体育馆进行深度强化学习策略梯度方法的分步教程。 在这个简短的项目中,我们将使用强化学习算法(策略梯度方法-REINFORCE)训练神经网络玩Pong游戏。 如果要运行它,则只需克隆存储库,然后打开钢筋_learning_pong_keras_policy_gradients.ipynb ,然后阅读并运行笔记本 我们训练了一个简单的200个隐藏的神经元网络和一个卷积模型。 简单网络的示例播放: 简单网络玩游戏的视频( ): 卷积网络玩游戏的视频( ): 考虑到有限的时间和出于学习目的,我并不是要寻找一个受过良好训练的代理,但我希望这个项目可以帮助人们熟悉rl算法和keras的基本过程。 上面的视频花了3天时间让代理在慢速的计算机上学习。 为了获得生产结果,需要更多的培训和调整,这不是我


【文件预览】:
deep_rl_pong_keras-master
----LICENSE(34KB)
----trained_simple_network.mp4(267KB)
----trained_simple_model_3300.h5(4.9MB)
----trained_convolutional_network.mp4(175KB)
----README.md(2KB)
----simple_network.gif(209KB)
----trained_conv_model.h5(141KB)
----trained_simple_model_1550.h5(4.9MB)
----reinforcement_learning_pong_keras_policy_gradients.ipynb(141KB)

网友评论