muzero-ray:使用ray库实现的MuZero for Atari

时间:2024-03-06 02:30:10
【文件属性】:

文件名称:muzero-ray:使用ray库实现的MuZero for Atari

文件大小:66KB

文件格式:ZIP

更新时间:2024-03-06 02:30:10

atari ray muzero Python

学习玩雅达利 这是使用光线分布式处理库的MuZero的实现。 它旨在玩Atari游戏Breakout。 不幸的是,尽管训练将继续进行,但是该模型无法学习。 显然存在未发现的错误或错误的超参数。 超参数在run.py muzero/muzero.py中设置,并在run.py覆盖。 设置 make venv 跑 首先,打开run.py并编辑ray配置,以具有所需的GPU,CPU和内存数量。 目前,它设置为在具有12个内核和64 GB RAM的3 GPU机器上运行。 然后从此仓库的根目录运行 source venv/bin/activate python run.py --logdir ./results --loglevel error breakout Ray仪表板将在。 如果在服务器上运行代码,请运行ssh -L 8265:localhost:8265 username@server以


【文件预览】:
muzero-ray-master
----.gitignore(56B)
----README.md(1KB)
----requirements-dev.txt(95B)
----LICENSE(1KB)
----requirements.txt(234B)
----CONTRIBUTORS(16B)
----setup.py(1KB)
----muzero-test-checkpoints.ipynb(18KB)
----muzero()
--------muzero_tf_policy.py(17KB)
--------mcts.py(15KB)
--------rollout_worker.py(7KB)
--------play.py(2KB)
--------worker_set.py(3KB)
--------util.py(2KB)
--------metrics.py(7KB)
--------learner_thread.py(3KB)
--------trainer.py(14KB)
--------replay_buffer.py(22KB)
--------env.py(7KB)
--------policy.py(5KB)
--------ops()
--------muzero.py(6KB)
--------structure_list.py(5KB)
--------rollout_metrics.py(1KB)
--------debug.py(127B)
--------sample_batch.py(23KB)
--------muzero_tf_model.py(16KB)
----Makefile(2KB)
----gcloud_run.py(4KB)
----requirements-missing.txt(147B)
----run.py(4KB)

网友评论