强化学习:SARSA,SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境

时间:2024-03-07 17:05:14
【文件属性】:

文件名称:强化学习:SARSA,SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境

文件大小:98KB

文件格式:ZIP

更新时间:2024-03-07 17:05:14

Python

项目概况: 该项目使用强化学习来解决出租车和山地车Open AI体育馆的问题。 对于出租车,可以在( )上详细探讨目标。 对于山地车,可以在( )上详细探讨目标。 为了解决出租车问题,我实现了SARSA和SARSA Lambda算法。 对于山地车问题,我将SARSA Lambda与函数逼近合并(使用傅立叶基础函数)。 运行说明: python3 taxi_sarsa.py 将执行SARSA学习算法,并将q值和策略保存到.npy文件。 。 注意:先前的学习序列中的存储库中已经包含一组默认的值/策略。 运行上面的命令将覆盖这些文件。 这还将创建一个带有该环境学习曲线的PNG文件。 python3 taxi_sarsa.py test 将在滑行环境的十次迭代中使用保存的策略,并打印出奖励(完成步骤)。 python3 taxi_sarsa_lambda.py 将执行SARS


【文件预览】:
Reinforcement-Learning-main
----policy_taxi_sarsa_lambda_grading.npy(4KB)
----qvalues_taxi_sarsa_grading.npy(24KB)
----rewards_plot_taxi_sarsa.png(27KB)
----rewards_plot_lambda.png(18KB)
----mountain_car_saved_weights_grading.npy(992B)
----policy_taxi_sarsa_grading.npy(4KB)
----taxi_sarsa.py(6KB)
----mountain_car_sarsa_fourier.py(6KB)
----requirements.txt(308B)
----tabular_sarsa.py(2KB)
----README.md(2KB)
----ignore_me.py(958B)
----qvalues_taxi_sarsa_lambda_grading.npy(24KB)
----taxi_sarsa_lambda.py(6KB)

网友评论