DQN-Atari:Atari pong的深度Q学习(DQN)实施

时间:2024-05-24 13:05:15
【文件属性】:

文件名称:DQN-Atari:Atari pong的深度Q学习(DQN)实施

文件大小:19.97MB

文件格式:ZIP

更新时间:2024-05-24 13:05:15

machine-learning reinforcement-learning pong pytorch dqn

DQN-雅达利 深度Q网络实现。 实施从论文《和得出。 结果 游戏视频-DQN Nature Paper 每集奖励 实施摘要 DQN自然架构实施 输入:84×84×4图像(使用历史记录的最后4帧) 转换层1:32个8×8滤光片,步幅为4 转换层2:64个4×4步幅的滤镜 转换层3:64个3×3滤光片,步幅为1 完全连接1:完全连接,由256个整流器单元组成 输出:完全连接的线性层,每个有效动作均具有单个输出。 DQN Neurips架构实施 输入:84×84×4图像(使用历史记录的最后4帧) 转换层1:16个8×8滤光片,步幅为4 转换层2:32个4×4步幅的滤镜 完全连接1:完全连接,由256个整流器单元组成 输出:完全连接的线性层,每个有效动作均具有单个输出。 其他参数 优化器:RMSProp 批量大小:32 电子贪婪:0.1 怎么跑 创建一个新环境 例子: conda


网友评论

  • [face]emoji:062.png[/face]学习学习,谢谢