matlabfig生成代码-PIs-for-RL-Problems-in-CTS:该存储库包含用于生成模拟结果的开放源代码,该结果显示在手稿“

时间:2024-06-15 17:38:38
【文件属性】:

文件名称:matlabfig生成代码-PIs-for-RL-Problems-in-CTS:该存储库包含用于生成模拟结果的开放源代码,该结果显示在手稿“

文件大小:27KB

文件格式:ZIP

更新时间:2024-06-15 17:38:38

系统开源

Matlab的无花果生成代码CTS中的RL问题的PI 该存储库提供了用于生成本文中显示的仿真结果的开源代码: “ Jaeyoung Lee和Richard S. Sutton(2021)连续时间和空间中强化学习问题的策略迭代-基本理论和方法,自动书,第126卷,109421。” 要在本文中重现结果,请根据以下说明运行代码(在MATLAB R2012a(32位)版本中进行测试)。 首先, 将MATLAB工作目录设置为您计算机中克隆的本地存储库路径; 使用以下命令清除环境: close all clear all clc 使用以下命令来再现与手稿中的模拟相对应的数据。 案例1:凹面哈密顿量奖赏(第7.1节) DPI: Main('DPI', 'Con', 'Normal', [20, 21], 50) IPI: Main('IPI', 'Con', 'Normal', [20, 21], 50) 情况2:最佳控制(第7.2节) DPI: Main('DPI', 'Opt', 'Normal', [20, 21], 50) IPI: Main('IPI', 'Opt', 'Normal


【文件预览】:
PIs-for-RL-Problems-in-CTS-master
----rk4_init.m(139B)
----NNFire.m(103B)
----num2ordinal.m(307B)
----Main.m(8KB)
----GetMarker4TrjGraph.m(1KB)
----utilities()
--------plot_discrete_time_gamma.m(345B)
----CLOSED_LOOP_SYS.m(557B)
----NNHiddenGradientFire.m(361B)
----Plot3DVF.m(2KB)
----LICENSE(34KB)
----Plot3DPolicy.m(2KB)
----DrawTrjGraph.m(5KB)
----ACTION_GENERATOR.m(436B)
----Normalize_x1.m(190B)
----R.m(1KB)
----NNHiddenFire.m(308B)
----.gitignore(509B)
----README.md(4KB)
----NNGradientFire.m(78B)
----rk4_closed.m(554B)

网友评论