rl-tutorials:强化学习的基本算法

时间:2024-04-17 04:55:12
【文件属性】:

文件名称:rl-tutorials:强化学习的基本算法

文件大小:3.16MB

文件格式:ZIP

更新时间:2024-04-17 04:55:12

Python

| 写在前面 本项目用于学习RL基础算法,尽量做到:注释详细,结构清晰。 代码结构主要分为以下几个脚本: model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy plot.py利用matplotlib或seaborn补充奖励图,包括滑动平均的奖励,结果保存在结果文件夹中 env.py用于重建强化学习环境,也可以重新自定义环境,例如给动作加噪声 agent.py RL核心算法,某种dqn等,主要包含update和choose_action两个方法, main.py运行主函数 其中model.py , memory.py , plot.py由于不同算法都会用到,所以放入common文件夹中。 运行环境 python 3.7,pytorch 1.6.0-1.7.1,gym 0.17.0-0.18.0 使用说明 对应算


网友评论