Reinforcement-Learning-using-OpenAI-Gym:适用于古典和MuJoCo环境的强化学习算法SARSA,Q-Learning,DQN,并通过OpenAI Gym进行测试

时间:2024-05-17 07:00:18
【文件属性】:

文件名称:Reinforcement-Learning-using-OpenAI-Gym:适用于古典和MuJoCo环境的强化学习算法SARSA,Q-Learning,DQN,并通过OpenAI Gym进行测试

文件大小:211KB

文件格式:ZIP

更新时间:2024-05-17 07:00:18

reinforcement-learning openai-gym q-learning dqn mountain-car

使用OpenAI-Gym进行强化学习 适用于古典和MuJoCo环境的强化学习算法SARSA,Q-Learning,DQN,并使用OpenAI Gym对其进行测试。 SARSA推车杆 SARSA(状态-行动-奖励-状态-行动)是一种简单的策略上强化学习算法,其中,代理尝试根据当前策略(ε贪婪)从当前状态以及下一个状态生成操作,以学习最佳策略。 针对OpenAI体育馆提供的经典环境“购物车极点”问题实施了SARSA。 问题目标: 购物车问题在每个时间步都有4种状态, [推车在水平轴上的位置, 推车在同一轴线上的速度, 杆子在推车上的角位置, 推车上杆的角速度] 推车可以执行2个操作[左移,右移]。 主要目标是在每个时间步长上采取适当的措施,以使推车上的杆子保持最长的平衡时间。 执行 将4个状态分别离散为[2,2,8,4]个离散状态,并为每个状态保持了特定的值范围。 使用衰减的探查


【文件预览】:
Reinforcement-Learning-using-OpenAI-Gym-master
----DQN()
--------cartpole_dqn.py(3KB)
--------cartpole_dqn.png(25KB)
----sarsa_cartpole.ipynb(27KB)
----README.md(5KB)
----q-learning cart pole.ipynb(26KB)
----Mountain_Car()
--------q_learning_mountain.png(55KB)
--------sarsa_mountain_car.py(2KB)
--------sarsa_mountain.png(53KB)
--------sarsa_lambda.py(3KB)
--------sarsa_lambda_mountain.png(46KB)
--------q_learning_mountain_cart.py(3KB)

网友评论