文件名称:matlab分时代码-kpirl-kla:该存储库包含两个新算法:KPIRL和KLA。KPIRL是Abbeel和Ng的ProjectionIR
文件大小:144KB
文件格式:ZIP
更新时间:2024-06-10 14:22:21
系统开源
matlab分时代码关键绩效指标 该存储库通过一致的接口实现了几种RL和IRL算法。 该项目中包括利用算法的三个示例问题“域”。 “巨大”域对应于原始KPIRL / KLA()中描述的实验和模型 安装 克隆存储库 要求 Matlab的 统计和机器学习工具箱(用于pdist2中的pdist2) 并行计算工具箱(用于整个存储库中的parfor ) 快速开始 根目录中提供了两个文件,用于“快速启动”。 这些文件应该是“开箱即用”的可执行文件。 这些文件使用“巨大”域,但可以很容易地与任何域一起使用。 文件内嵌提供了进一步的文档。 qs_compare.m-使用下面介绍的基准测试API比较“巨大”域中的RL算法 qs_inverse.m-在“巨大”域中使用KPIRL求解奖励函数 架构原则/权衡 该存储库主要是为了易于理解和可扩展性而设计的。 为此,代码在很大程度上依赖于MATLAB的闭包功能,以在减少依赖关系的同时保留状态。 该决定的结果是矢量化的减少和函数调用的增加。 综上所述,这意味着使用不同的实现还有很大的计算改进空间。 目录结构 root └–––algorithms - contai