Reinforcement-Learning-in-Blackjack:用于玩二十一点变体的几种强化学习算法的实现下载

【文件属性】：

文件名称：Reinforcement-Learning-in-Blackjack:用于玩二十一点变体的几种强化学习算法的实现

文件大小：14KB

文件格式：ZIP

更新时间：2024-07-03 16:25:09

Python

强化学习在二十一点用于玩二十一点变体的几种强化学习算法的实现为了运行所有算法，只需运行 main.py。这将执行 test_all_algorithms() 函数，该函数运行 MC、SARSA 和线性函数近似与 SARSA，并带有显示结果的图。其他模块的详细信息： environment.py - 包含 step() 函数和环境的实现 rl_algorithms - 包含 MC、SARSA 和线性函数逼近 plotting.py - 包含绘制值函数、SARSA 和 LFA 结果的函数 policy.py - 放置策略的地方，目前只包含 epsilon 贪婪策略 Utility.py - 计算均方误差并将状态转换为 LFA 的特征向量

立即下载

【文件预览】：
Reinforcement-Learning-in-Blackjack-master
----README.md(807B)
----Data()
--------MC_value_function.pickle(16KB)
----plotting.py(2KB)
----main.py(4KB)
----environment.py(2KB)
----rl_algorithms.py(10KB)
----policies.py(2KB)
----utilities.py(2KB)

秒客网

Reinforcement-Learning-in-Blackjack:用于玩二十一点变体的几种强化学习算法的实现

网友评论

相关文章