文件名称:reinforce:Python中的简单强化学习
文件大小:54KB
文件格式:ZIP
更新时间:2024-06-11 06:34:50
Python
加强 Python中的“即插即用”强化学习库。 根据数据推断马尔可夫决策过程并求解最佳策略。 基于Andrew Ng的 与该项目有关的更多信息可以在找到 用法示例 observations = [ { 'state_transitions' : [ { 'state' : 'low' , 'action' : 'climb' , 'state_' : 'mid' }, { 'state' : 'mid' , 'action' : 'climb' , 'state_' : 'high' }, { 'state' : 'high' , 'action' : 'sink' , 'state_' : 'mid' }, { 'state' : 'mid' , 'action' : 'sink' , 'state_' : 'low' },
【文件预览】:
reinforce-master
----reinforce()
--------rewards.py(860B)
--------encoding.py(2KB)
--------policy.py(971B)
--------__init__.py(20B)
--------learn.py(980B)
--------transitions.py(1KB)
----MDP.png(53KB)
----setup.py(321B)
----README.md(2KB)
----.gitignore(32B)