强化学习算法:一些流行的RL算法的实现

时间:2024-03-13 20:44:43
【文件属性】:

文件名称:强化学习算法:一些流行的RL算法的实现

文件大小:932KB

文件格式:ZIP

更新时间:2024-03-13 20:44:43

JupyterNotebook

安装 首先在requirements.txt安装需求,然后运行pip install -e .


【文件预览】:
Algorithms-for-Reinforcement-Learning-master
----.gitignore(13B)
----README.md(92B)
----.pre-commit-config.yaml(260B)
----references()
--------README.md(936B)
----src()
--------RL()
----figures()
--------eligibility_trace_td_lambda.png(4KB)
--------reinforce_baseline_pseudo_code.png(64KB)
--------td_lambda_update.png(2KB)
--------true_online_sarsa_pseudo_code.png(75KB)
--------reinforce_pseudo_code.png(49KB)
--------generalized_pg_theorem.png(6KB)
--------policy_gradient_theorem.png(5KB)
--------reinforce_update.png(5KB)
--------td_error.png(4KB)
--------dqn_pseudo_code.png(71KB)
--------ddqn_update.png(6KB)
--------monte_carlo_es_pseudo_code.png(73KB)
--------actor_critic_pseudo_code.png(67KB)
--------sarsa_pseudo_code.png(56KB)
--------update_dqn.png(8KB)
--------td_lambda_pseudo_code.png(60KB)
--------sarsa_lambda_pseudo_code.png(87KB)
--------qlearning_pseudo_code.png(50KB)
--------true_online_td_lambda_pseudo_code.png(75KB)
----requirements.txt(37B)
----.idea()
--------.gitignore(47B)
--------vcs.xml(181B)
--------misc.xml(195B)
--------modules.xml(257B)
--------RL.iml(571B)
--------inspectionProfiles()
----notebooks()
--------REINFORCE.ipynb(200KB)
--------Temporal_Difference_Learning.ipynb(10KB)
----setup.py(696B)
----data()
--------frozen_lake_deterministic_transition.npy(8KB)
--------frozen_lake_stochastic_transition.npy(8KB)

网友评论