【文件属性】:
文件名称:rl-tutorials:强化学习的基本算法
文件大小:3.16MB
文件格式:ZIP
更新时间:2021-03-28 11:08:32
Python
|
写在前面
本项目用于学习RL基础算法,尽量做到:注释详细,结构清晰。
代码结构主要分为以下几个脚本:
model.py强化学习算法的基本模型,局部神经网络,演员,评论家等
memory.py保存重放缓冲区,用于off-policy
plot.py利用matplotlib或seaborn补充奖励图,包括滑动平均的奖励,结果保存在结果文件夹中
env.py用于重建强化学习环境,也可以重新自定义环境,例如给动作加噪声
agent.py RL核心算法,某种dqn等,主要包含update和choose_action两个方法,
main.py运行主函数
其中model.py , memory.py , plot.py由于不同算法都会用到,所以放入common文件夹中。
运行环境
python 3.7,pytorch 1.6.0-1.7.1,gym 0.17.0-0.18.0
使用说明
对应算