文件名称:CQL:保守的Q学习代码
文件大小:555KB
文件格式:ZIP
更新时间:2024-05-02 13:56:18
Python
CQL 离线强化学习的保守Q学习代码( ) 在此存储库中,我们提供了上面链接的论文中描述的CQL算法代码。 我们在两个子目录中提供代码: atari包含用于Atari实验的代码,而d4rl包含用于D4RL实验的代码。 由于D4RL中数据集的变化,我们希望新D4RL数据集的CQL性能会有所变化,因此我们将在本自述文件中的此处很快为CQL提供一个具有新性能编号的表。 我们将继续在这里更新数字。 如果您发现此存储库对您的研究有用,请引用: @article{kumar2020conservative, author = {Aviral Kumar and Aurick Zhou and George Tucker and Sergey Levine}, title = {Conservative Q-Learning for Offline Reinf