FOCAL-ICLR:提交给ICLR 2021的FOCAL论文代码

时间:2024-05-02 12:52:14
【文件属性】:

文件名称:FOCAL-ICLR:提交给ICLR 2021的FOCAL论文代码

文件大小:2.57MB

文件格式:ZIP

更新时间:2024-05-02 12:52:14

Python

FOCAL:通过距离度量学习和行为规则化进行高效的全离线元强化学习 通过在许多实际应用中启用RL算法,用于脱机强化学习(OMRL)的元学习是一个未被充分研究的问题,具有巨大的潜在影响。 该问题的一种流行解决方案是使用基于上下文的编码器将任务身份推断为增强状态,对此有效地学习任务表示仍然是一个挑战。 在这项工作中,我们通过结合任务内注意机制和任务间对比学习目标,改进了SOTA OMRL算法之一FOCAL,以更有效地进行任务推理和控制学习。 进行理论分析和实验,以证明我们的端到端和无模型方法与跨多个meta-RL基准的现有算法相比,具有优越的性能,效率和鲁棒性。 安装 要在本地安装,您需要首先安装 。 对于奖励功能有所不同的任务分布(猎豹,蚂蚁),请安装MuJoCo150或plus。 设置LD_LIBRARY_PATH指向MuJoCo二进制文件( /$HOME/.mujoco/mujoco20


网友评论