jax-rl:核心Deep RL算法的JAX实现

时间:2024-06-11 13:38:31
【文件属性】:

文件名称:jax-rl:核心Deep RL算法的JAX实现

文件大小:198KB

文件格式:ZIP

更新时间:2024-06-11 13:38:31

reinforcement-learning deep-learning deep-reinforcement-learning flax deepmind

jax-rl 相对于PyTorch和TensorFlow,使用JAX的核心深度强化学习算法可提高性能。 控制任务依赖于; 如果您尚未配置MuJoCo,请参阅回购以进行进一步的设置。 当前实施 TD3 SAC MPO 环境与测试 此仓库使用poetry包和依赖管理工具。 要使用所有必需的软件包来构建本地环境,请运行: make init 要测试本地更改,请运行: make test 跑步 要在基本目录中运行每个算法,请执行以下操作: python jax_rl/main_dm_control.py --policy TD3 --max_timestep 100000 python jax_rl/main_dm_control.py --policy SAC --max_timesteps 100000 python jax_rl/main_dm_control.py --po


【文件预览】:
jax-rl-master
----.flake8(194B)
----poetry.lock(142KB)
----jax_rl()
--------buffers.py(1KB)
--------MPO.py(16KB)
--------main_dm_control.py(5KB)
--------saving.py(476B)
--------utils.py(4KB)
--------SAC.py(8KB)
--------__init__.py(0B)
--------train_loops.py(2KB)
--------models.py(6KB)
--------TD3.py(6KB)
----LICENSE(1KB)
----README.md(3KB)
----Makefile(160B)
----.pre-commit-config.yaml(1KB)
----docs()
--------_static()
----tests()
--------test_mpo.py(1KB)
--------utils.py(275B)
--------__init__.py(0B)
--------test_td3.py(1KB)
--------test_sac.py(1KB)
----.gitignore(104B)
----pyproject.toml(1KB)

网友评论