Reinforcement-Learning-using-OpenAI-Gym:适用于古典和MuJoCo环境的强化学习算法SARSA，Q-Learning，DQN，并通过OpenAI Gym进行测试下载

【文件属性】：

文件名称：Reinforcement-Learning-using-OpenAI-Gym:适用于古典和MuJoCo环境的强化学习算法SARSA，Q-Learning，DQN，并通过OpenAI Gym进行测试

文件大小：211KB

文件格式：ZIP

更新时间：2024-05-17 07:00:18

reinforcement-learning openai-gym q-learning dqn mountain-car

使用OpenAI-Gym进行强化学习适用于古典和MuJoCo环境的强化学习算法SARSA，Q-Learning，DQN，并使用OpenAI Gym对其进行测试。 SARSA推车杆 SARSA（状态-行动-奖励-状态-行动）是一种简单的策略上强化学习算法，其中，代理尝试根据当前策略（ε贪婪）从当前状态以及下一个状态生成操作，以学习最佳策略。针对OpenAI体育馆提供的经典环境“购物车极点”问题实施了SARSA。问题目标：购物车问题在每个时间步都有4种状态， [推车在水平轴上的位置，推车在同一轴线上的速度，杆子在推车上的角位置，推车上杆的角速度] 推车可以执行2个操作[左移，右移]。主要目标是在每个时间步长上采取适当的措施，以使推车上的杆子保持最长的平衡时间。执行将4个状态分别离散为[2,2,8,4]个离散状态，并为每个状态保持了特定的值范围。使用衰减的探查

立即下载

【文件预览】：
Reinforcement-Learning-using-OpenAI-Gym-master
----DQN()
--------cartpole_dqn.py(3KB)
--------cartpole_dqn.png(25KB)
----sarsa_cartpole.ipynb(27KB)
----README.md(5KB)
----q-learning cart pole.ipynb(26KB)
----Mountain_Car()
--------q_learning_mountain.png(55KB)
--------sarsa_mountain_car.py(2KB)
--------sarsa_mountain.png(53KB)
--------sarsa_lambda.py(3KB)
--------sarsa_lambda_mountain.png(46KB)
--------q_learning_mountain_cart.py(3KB)

秒客网

Reinforcement-Learning-using-OpenAI-Gym:适用于古典和MuJoCo环境的强化学习算法SARSA，Q-Learning，DQN，并通过OpenAI Gym进行测试

网友评论

相关文章