MuZero:MuZero的结构化实现

时间:2024-05-13 23:24:38
【文件属性】:

文件名称:MuZero:MuZero的结构化实现

文件大小:19KB

文件格式:ZIP

更新时间:2024-05-13 23:24:38

reinforcement-learning tensorflow world-models muzero Python

零 该存储库是MuZero算法的Python实现。 它基于和描述Muzero框架的。 神经计算是通过Tensorflow实现的。 您可以轻松地训练自己的MuZero,特别是针对一个播放器和非基于图像的环境(例如 )。 如果您希望在其他类型的环境上训练Muzero,则可以对该代码库进行少量修改即可使用。 免责声明:此代码是早期研究代码。 这意味着: 可能存在无提示的错误。 它可能无法在其他环境或其他超参数上可靠地工作。 相当缺乏代码质量和文档,并且许多代码可能仍感觉“正在进行中”。 培训和测试管道不是很先进。 依存关系 我们使用以下代码运行此代码: conda4.7.12 Python 3.7 Tensorflow 2.0.0 脾气暴躁的1.17.3 训练您的MuZero 此代码必须从muzero.py的main函数运行(不要忘记首先配置conda环境)。 训练Cart


【文件预览】:
MuZero-master
----.gitignore(2KB)
----README.rst(4KB)
----muzero()
--------training()
--------networks()
--------config.py(6KB)
--------game()
--------self_play()
--------__init__.py(0B)
--------muzero.py(1KB)

网友评论