【文件属性】:
文件名称:reinforce:Python中的简单强化学习
文件大小:54KB
文件格式:ZIP
更新时间:2021-05-22 12:48:10
Python
加强
Python中的“即插即用”强化学习库。
根据数据推断马尔可夫决策过程并求解最佳策略。
基于Andrew Ng的
与该项目有关的更多信息可以在找到
用法示例
observations = [
{ 'state_transitions' : [
{ 'state' : 'low' , 'action' : 'climb' , 'state_' : 'mid' },
{ 'state' : 'mid' , 'action' : 'climb' , 'state_' : 'high' },
{ 'state' : 'high' , 'action' : 'sink' , 'state_' : 'mid' },
{ 'state' : 'mid' , 'action' : 'sink' , 'state_' : 'low' },
【文件预览】:
reinforce-master
----reinforce()
--------rewards.py(860B)
--------encoding.py(2KB)
--------policy.py(971B)
--------__init__.py(20B)
--------learn.py(980B)
--------transitions.py(1KB)
----MDP.png(53KB)
----setup.py(321B)
----README.md(2KB)
----.gitignore(32B)