文件名称:isql:从行为推论对动力的信念
文件大小:69KB
文件格式:ZIP
更新时间:2024-06-06 09:38:28
JupyterNotebook
逆向软Q学习 从他们的控制演示中了解代理对环境动态的信念。 用法 使用软件包管理器安装Python依赖项 pip install -r requirements.txt 安装(版本0.9.2)并更换gym/envs/box2d/lunar_lander.py与isql/lunar_lander.py 。 安装并将baselines/baselines/deepq/{build_graph|simple}.py替换为isql/{build_graph|simple}.py 。 到isql/ 。 问题和意见 如果您有疑问或发现错误,请通过sgr [at] berkeley [dot] edu与作者联系。 请注意,并非所有单元格都井井有条,因此您可能必须四处寻找处理NameErrors的方法。 引文 如果您发现此软件在您的工作中很有用,我们恳请您引用以下: @InProceedings
【文件预览】:
isql-master
----1.0-tabular-ime.ipynb(53KB)
----.gitignore(20B)
----simple.py(12KB)
----requirements.txt(40B)
----2.0-tabular-irl.ipynb(53KB)
----LICENSE(11KB)
----1.1-tabular-ime.ipynb(60KB)
----README.md(1KB)
----5.1-lander-ime.ipynb(38KB)
----5.0-lander-ime.ipynb(54KB)
----build_graph.py(19KB)
----lunar_lander.py(23KB)
----3.0-continuous-ime.ipynb(61KB)