markov-decision-processes下载

【文件属性】：

文件名称：markov-decision-processes

文件大小：1.27MB

文件格式：ZIP

更新时间：2024-06-03 00:40:18

reinforcement-learning openai-gym JupyterNotebook

OpenAI学者：强化学习自学第一周：马尔可夫决策过程资源强化学习：简介，萨顿和巴托，第二版第3章：马尔可夫决策过程和第4章：动态编程 Deep RL Bootcamp核心讲座1 MDP介绍和精确的解决方法-Pieter Abbeel| Deep RL Bootcamp核心讲座2基于样本的近似值和拟合学习-洛基·杜安（Rocky Duan）| Deep RL Bootcamp实验1： Markov决策过程您将实现值迭代，策略迭代和表格Q学习，并将这些算法应用于简单的环境，包括表格迷宫导航（FrozenLake）和控制简单的爬虫机器人。 CS294强化学习简介-Levine | CS294值函数介绍-Levine | OpenAI Joshua Achiam介绍了强化学习笔记 RL算法图马尔可夫决策过程中的相互作用 MDP中的值迭代 OpenAI的Crawler机器

立即下载

【文件预览】：
markov-decision-processes-master
----.gitignore(49B)
----images()
--------mdp_valueiteration.gif(59KB)
--------mdp_brain.png(723KB)
--------rl_algo_diagram.png(42KB)
--------mdp_brain_500.png(140KB)
----videos()
--------crawler_random.mp4(118KB)
--------crawler_qlearn_epsgreedy_30000.mp4(162KB)
----README.md(2KB)
----lab1()
--------frozen_lake.py(6KB)
--------LICENSE(1KB)
--------Lab 1 - Problem 1.ipynb(106KB)
--------misc.py(7KB)
--------crawler_env.py(16KB)
--------Lab 1 - Problem 3.ipynb(14KB)
--------environment.yml(713B)
--------Lab 1 - Problem 2.ipynb(29KB)
--------discrete_env.py(3KB)
--------lab1.md(592B)

秒客网

markov-decision-processes

网友评论