【文件属性】:
文件名称:JAX-RL:各种强化学习算法的JAX实现
文件大小:14KB
文件格式:ZIP
更新时间:2021-03-30 00:57:27
reinforcement-learning haiku jax optax Python
JAX-RL
各种深度强化学习算法的JAX实现。
使用的主要库:
JAX-主要框架
ku句-神经网络
Optax-基于梯度的优化
算法:
| 近端策略优化(PPO)| 1 | | 深度Q网络(DQN)| 1 | | 双深度Q网络(DDQN)| 1 | | 深度递归Q网络(DRQN)| 1 | | 深度确定性策略梯度(DDPG)| 1 |
政策:
psi贪婪
玻尔兹曼
去做:
每种算法的完整测试
其他基于PPO的算法?
优先体验重播
多代理DQN和DDPG
【文件预览】:
JAX-RL-main
----jax_rl()
--------algorithms()
--------buffer.py(3KB)
--------utils.py(1015B)
--------__init__.py(138B)
--------policies.py(2KB)
----README.md(582B)
----tests()
--------test_jax_rl.py(120B)
----.gitignore(2KB)