文件名称:Reinforcement-Learning-in-Blackjack:用于玩二十一点变体的几种强化学习算法的实现
文件大小:14KB
文件格式:ZIP
更新时间:2024-07-03 16:25:09
Python
强化学习在二十一点 用于玩二十一点变体的几种强化学习算法的实现 为了运行所有算法,只需运行 main.py。 这将执行 test_all_algorithms() 函数,该函数运行 MC、SARSA 和线性函数近似与 SARSA,并带有显示结果的图。 其他模块的详细信息: environment.py - 包含 step() 函数和环境的实现 rl_algorithms - 包含 MC、SARSA 和线性函数逼近 plotting.py - 包含绘制值函数、SARSA 和 LFA 结果的函数 policy.py - 放置策略的地方,目前只包含 epsilon 贪婪策略 Utility.py - 计算均方误差并将状态转换为 LFA 的特征向量
【文件预览】:
Reinforcement-Learning-in-Blackjack-master
----README.md(807B)
----Data()
--------MC_value_function.pickle(16KB)
----plotting.py(2KB)
----main.py(4KB)
----environment.py(2KB)
----rl_algorithms.py(10KB)
----policies.py(2KB)
----utilities.py(2KB)