文件名称:markov-decision-processes
文件大小:1.27MB
文件格式:ZIP
更新时间:2024-06-03 00:40:18
reinforcement-learning openai-gym JupyterNotebook
OpenAI学者:强化学习自学 第一周:马尔可夫决策过程 资源 强化学习:简介,萨顿和巴托,第二版第3章:马尔可夫决策过程和第4章:动态编程 Deep RL Bootcamp核心讲座1 MDP介绍和精确的解决方法-Pieter Abbeel| Deep RL Bootcamp核心讲座2基于样本的近似值和拟合学习-洛基·杜安(Rocky Duan)| Deep RL Bootcamp实验1: Markov决策过程您将实现值迭代,策略迭代和表格Q学习,并将这些算法应用于简单的环境,包括表格迷宫导航(FrozenLake)和控制简单的爬虫机器人。 CS294强化学习简介-Levine | CS294值函数介绍-Levine | OpenAI Joshua Achiam介绍了强化学习 笔记 RL算法图 马尔可夫决策过程中的相互作用 MDP中的值迭代 OpenAI的Crawler机器
【文件预览】:
markov-decision-processes-master
----.gitignore(49B)
----images()
--------mdp_valueiteration.gif(59KB)
--------mdp_brain.png(723KB)
--------rl_algo_diagram.png(42KB)
--------mdp_brain_500.png(140KB)
----videos()
--------crawler_random.mp4(118KB)
--------crawler_qlearn_epsgreedy_30000.mp4(162KB)
----README.md(2KB)
----lab1()
--------frozen_lake.py(6KB)
--------LICENSE(1KB)
--------Lab 1 - Problem 1.ipynb(106KB)
--------misc.py(7KB)
--------crawler_env.py(16KB)
--------Lab 1 - Problem 3.ipynb(14KB)
--------environment.yml(713B)
--------Lab 1 - Problem 2.ipynb(29KB)
--------discrete_env.py(3KB)
--------lab1.md(592B)