JAX-RL:各种强化学习算法的JAX实现

时间:2024-04-18 18:44:07
【文件属性】:

文件名称:JAX-RL:各种强化学习算法的JAX实现

文件大小:14KB

文件格式:ZIP

更新时间:2024-04-18 18:44:07

reinforcement-learning haiku jax optax Python

JAX-RL 各种深度强化学习算法的JAX实现。 使用的主要库: JAX-主要框架 ku句-神经网络 Optax-基于梯度的优化 算法: | 近端策略优化(PPO)| 1 | | 深度Q网络(DQN)| 1 | | 双深度Q网络(DDQN)| 1 | | 深度递归Q网络(DRQN)| 1 | | 深度确定性策略梯度(DDPG)| 1 | 政策: psi贪婪 玻尔兹曼 去做: 每种算法的完整测试 其他基于PPO的算法? 优先体验重播 多代理DQN和DDPG


【文件预览】:
JAX-RL-main
----jax_rl()
--------algorithms()
--------buffer.py(3KB)
--------utils.py(1015B)
--------__init__.py(138B)
--------policies.py(2KB)
----README.md(582B)
----tests()
--------test_jax_rl.py(120B)
----.gitignore(2KB)

网友评论