强化学习：SARSA，SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境下载

【文件属性】：

文件名称：强化学习：SARSA，SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境

文件大小：98KB

文件格式：ZIP

更新时间：2024-03-07 17:05:14

Python

项目概况：该项目使用强化学习来解决出租车和山地车Open AI体育馆的问题。对于出租车，可以在（）上详细探讨目标。对于山地车，可以在（）上详细探讨目标。为了解决出租车问题，我实现了SARSA和SARSA Lambda算法。对于山地车问题，我将SARSA Lambda与函数逼近合并（使用傅立叶基础函数）。运行说明： python3 taxi_sarsa.py 将执行SARSA学习算法，并将q值和策略保存到.npy文件。。注意：先前的学习序列中的存储库中已经包含一组默认的值/策略。运行上面的命令将覆盖这些文件。这还将创建一个带有该环境学习曲线的PNG文件。 python3 taxi_sarsa.py test 将在滑行环境的十次迭代中使用保存的策略，并打印出奖励（完成步骤）。 python3 taxi_sarsa_lambda.py 将执行SARS

立即下载

【文件预览】：
Reinforcement-Learning-main
----policy_taxi_sarsa_lambda_grading.npy(4KB)
----qvalues_taxi_sarsa_grading.npy(24KB)
----rewards_plot_taxi_sarsa.png(27KB)
----rewards_plot_lambda.png(18KB)
----mountain_car_saved_weights_grading.npy(992B)
----policy_taxi_sarsa_grading.npy(4KB)
----taxi_sarsa.py(6KB)
----mountain_car_sarsa_fourier.py(6KB)
----requirements.txt(308B)
----tabular_sarsa.py(2KB)
----README.md(2KB)
----ignore_me.py(958B)
----qvalues_taxi_sarsa_lambda_grading.npy(24KB)
----taxi_sarsa_lambda.py(6KB)

秒客网

强化学习：SARSA，SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境

网友评论

相关文章