【文件属性】:
文件名称:matlab中存档算法代码-python-mdp-toolkit:python-mdp-toolkit
文件大小:63KB
文件格式:ZIP
更新时间:2021-05-23 23:17:28
系统开源
matlab中存档算法代码适用于Python的Markov决策过程(MDP)工具箱
MDP工具箱提供用于解决离散时间马尔可夫决策过程的类和功能。
已实现的算法列表包括向后归纳,线性编程,策略迭代,q学习和值迭代以及若干变体。
这些类和功能是根据(法国)的进行开发的。
有适用于MATLAB,GNU
Octave,Scilab和R的版本。MDP工具箱套件在Chades
I,Chapron
G,Cros
MJ,Garcia
F&Sabbadin
R(2014)'MDPtoolbox:解决随机问题的多平台工具箱中进行了描述。动态规划问题”,《人口统计学》
,第1卷。
37号,第9页,第916–920页,土井。
特征
实施了八种MDP算法
使用快速数组操作
全面的稀疏矩阵支持,使用
可选的线性编程支持,使用
请注意:由于不正确的行为,目前除了测试目的之外,线性编程算法不可用。
安装
NumPy和SciPy必须在您的系统上才能使用此工具箱。
请查看他们的文档以进行安装。
如果要安装到Ubuntu或Debian上并使用Python
2,则这将引入所有依赖项:
sudo
apt-get
install
【文件预览】:
python-mdp-toolkit-master
----README.rst(7KB)
----LICENSE.txt(2KB)
----src()
--------experimental()
--------examples()
--------tests()
--------mdptoolbox()
----runtests.sh(236B)
----.travis.yml(2KB)
----setup.py(2KB)
----docs()
--------make.bat(7KB)
--------conf.py(10KB)
--------requirements.txt(30B)
--------index.rst(226B)
--------Makefile(7KB)
--------api()
----.gitignore(66B)