文件名称:探索-重新实现:重新实现我的控制探索工作
文件大小:4.54MB
文件格式:ZIP
更新时间:2024-03-17 03:07:01
JupyterNotebook
高效采样 arXiv论文中的实验 没有奖励 Gridworld: 我们的方法(因子+快速+乐观): python main.py --eval_every 1 --env gridworld --task default --n_state_bins 20 --env_size 20 --n_action_bins 4 --max_steps 100 --policy uniform --name grid20_puniform 不乐观: python main.py --eval_every 1 --env gridworld --task default --n_state_bins 20 --env_size 20 --n_action_bins 4 --max_steps 100 --policy uniform --no_optimistic_updates --no_opt
【文件预览】:
exploration-reimplementation-master
----visit counts.ipynb(20.3MB)
----dmcontrol_gridworld.py(3KB)
----experiment_logging.py(5KB)
----main_ablation_slow.py(23KB)
----gridworld.py(3KB)
----onehot_deep_q_functions.py(3KB)
----q_learning.py(9KB)
----.gitmodules(114B)
----point.xml(2KB)
----densities()
--------kernel_count.py(12KB)
--------knn_kernel_count.py(13KB)
--------__init__.py(0B)
--------kernel_density.py(7KB)
--------dummy_density.py(408B)
----.vscode()
--------launch.json(1KB)
--------settings.json(226B)
----utils.py(12KB)
----memory.prof(4KB)
----jax_specs.py(2KB)
----runner.py(6KB)
----main.py(29KB)
----kernel_benchmarks.py(8KB)
----replay_buffer.py(5KB)
----tabular_q_functions.py(3KB)
----LICENSE(11KB)
----profiling.ipynb(25KB)
----main_ablation_intrinsic.py(13KB)
----deep_q_functions.py(6KB)
----jax_replay_buffer.py(4KB)
----main_jit_density.py(26KB)
----point.py(5KB)
----kernel density toy.ipynb(47KB)
----results.ipynb(9.37MB)
----policies()
--------tabular_q_policy.py(2KB)
--------sac_policy.py(2KB)
--------deep_q_policy.py(4KB)
--------uniform_policy.py(1KB)
--------__init__.py(0B)
--------pytorch_sac()
----results-scaling.ipynb(15.39MB)
----count testing.ipynb(156KB)
----.gitignore(2KB)
----sigmoid_q_functions.py(2KB)
----observation_domains.py(6KB)
----readme.md(4KB)
----results-ufo.ipynb(3.59MB)
----tabular_density.py(6KB)
----visit counts scaling.ipynb(686KB)