rllab-微调

时间:2024-03-11 02:23:45
【文件属性】:

文件名称:rllab-微调

文件大小:1.65MB

文件格式:ZIP

更新时间:2024-03-11 02:23:45

Python

实验室 分层强化学习的子策略适应 要运行针对“分层强化学习的子策略调整”的论文的实验,请导航至sandbox/finetuning/README.md以查看说明。 引用子策略适应以进行分层强化学习 如果您将我们的代码用于学术研究,强烈建议您引用以下文章: 亚历山大·李(Alex C. “。”。 2020年第八届国际学习代表大会(ICLR)会议录。 贷记项目代码 我们以原始rllab代码以及由 (UC Berkeley / Covariant)开发的代码为。 (加州大学伯克利分校/ CMU)是该项目的主要开发商。 实验室 rllab是用于开发和评估强化学习算法的框架。 它包括各种各样的连续控制任务以及以下算法的实现: rllab与完全兼容。 有关说明和示例,请参见。 rllab仅正式支持Python 3.5+。 对于坐在Python 2上的rllab的旧快照,请使用。 rllab支


网友评论