文件名称:world_models
文件大小:103KB
文件格式:ZIP
更新时间:2024-05-04 09:02:23
Python
世界模型库 World Models是一个与平台无关的库,可促进基于视觉的代理进行计划。 这个笔记本( )展示了如何使用World Models库及其不同的组件。 要在本地运行,请使用以下命令: python3 -m world_models.bin.train_eval \ --config_path=/path/to/config \ --output_dir=/path/to/output_dir \ --logtostderr 实验结果 以下是我们的发现的摘要。 有关完整的讨论,请参见我们的论文: 预测未来的奖励是否足以在基于视觉模型的强化学习中取得成功? 我们通过实验证明,在线设置通常不是这种情况,关键是也可以预测将来的图像。 令人惊讶的是,这还意味着报酬预测准确性与代理绩效之间的相关性很弱。 但是,我们表明图像重建误差与代理性能之间存在更强的
【文件预览】:
world_models-master
----planners()
--------planners.py(23KB)
--------__init__.py(575B)
----tasks()
--------tasks.py(3KB)
--------__init__.py(575B)
----README.md(2KB)
----utils()
--------nested.py(7KB)
--------npz.py(4KB)
--------visualization.py(8KB)
--------wrappers.py(9KB)
--------__init__.py(575B)
----bin()
--------e2e_test.py(2KB)
--------eval.py(9KB)
--------train_eval.py(3KB)
--------__init__.py(575B)
----objectives()
--------__init__.py(575B)
--------objectives.py(2KB)
----configs()
--------rewnet_cem_atari.gin(2KB)
--------sv2p_tfcem_cheetah.gin(2KB)
--------planet_cem_cheetah.gin(2KB)
--------sv2p_cem_atari.gin(2KB)
--------planet_cem_walker.gin(2KB)
--------tests()
--------pure_reward_cem_cheetah.gin(2KB)
--------rewnet_offline_eval.gin(1KB)
--------sv2p_offline_eval.gin(1KB)
--------jax_pure_reward_cem_cheetah.gin(2KB)
--------pure_reward.gin(1KB)
--------pure_reward_cem_atari.gin(2KB)
--------rewnet.gin(2KB)
--------planet.gin(2KB)
--------rewnet_cem_cheetah.gin(2KB)
--------sv2p_pycem_cheetah.gin(2KB)
--------planet_offline_eval.gin(1KB)
--------planet_mppi_cheetah.gin(2KB)
--------pure_reward_offline_eval.gin(1KB)
--------planet_cem_atari.gin(2KB)
--------jax_pure_reward.gin(1KB)
--------sv2p.gin(1KB)
----LICENSE(11KB)
----loops()
--------train_eval.py(8KB)
--------__init__.py(575B)
----agents()
--------jax_pure_reward.py(5KB)
--------planet.py(19KB)
--------sv2p.py(11KB)
--------__init__.py(575B)
--------pure_reward.py(8KB)
----CONTRIBUTING.md(1KB)
----__init__.py(575B)
----intro.ipynb(20KB)
----imported_models()
--------sv2p_tests.py(1KB)
--------sv2p_hparams.py(1KB)
--------common.py(1KB)
--------tests_utils.py(7KB)
--------sv2p.py(18KB)
--------__init__.py(575B)
--------layers.py(20KB)
--------reward_models.py(5KB)
----setup.py(2KB)
----simulate()
--------__init__.py(575B)
--------simulate.py(5KB)