文件名称:imitation-learning:模仿学习算法
文件大小:999KB
文件格式:ZIP
更新时间:2024-05-13 00:26:41
deep-learning deep-reinforcement-learning imitation-learning Python
深度模仿学习的语用观察 模仿学习算法(使用PPO ): 美国广播公司 AIRL 公元前 钻头 童话 盖尔 GMMIL nn-PUGAIL PWIL 红色 python main.py --imitation [AIRL|BC|DRIL|FAIRL|GAIL|GMMIL|PUGAIL|RED] 选项包括: 仅状态模仿学习: --state-only 吸收状态指示器 --absorbing R1梯度正则化 :-- --r1-reg-coeff 1 (默认值) 结果 PPO 火车 测试 航空 火车 测试 公元前 火车 测试 钻头 火车 测试 公平 火车 测试 盖尔 火车 测试 吉米 火车 测试 nn-PUGAIL 火车 测试 红色的 火车 测试 致谢 @ikostrikov ( https://github.com/ikostrikov
【文件预览】:
imitation-learning-master
----.gitignore(2KB)
----training.py(8KB)
----LICENSE.md(1KB)
----expert_trajectories.pth(788KB)
----models.py(8KB)
----utils.py(851B)
----README.md(4KB)
----figures()
--------bc_test_returns.png(12KB)
--------gail_test_returns.png(30KB)
--------dril_test_returns.png(24KB)
--------red_train_returns.png(58KB)
--------ppo_train_returns.png(58KB)
--------fairl_train_returns.png(54KB)
--------red_test_returns.png(25KB)
--------pugail_test_returns.png(29KB)
--------ppo_test_returns.png(28KB)
--------fairl_test_returns.png(30KB)
--------gail_train_returns.png(37KB)
--------dril_train_returns.png(56KB)
--------airl_test_returns.png(33KB)
--------gmmil_test_returns.png(30KB)
--------airl_train_returns.png(47KB)
--------gmmil_train_returns.png(52KB)
--------pugail_train_returns.png(37KB)
----main.py(11KB)
----evaluation.py(1KB)
----environments.py(896B)