muzero_beginner

时间:2024-05-08 19:19:49
【文件属性】:

文件名称:muzero_beginner

文件大小:58KB

文件格式:ZIP

更新时间:2024-05-08 19:19:49

Python

muzero_beginner 项目介绍: 这是我尝试在180天内了解MuZero模型的尝试。 我的目标是类似于LCZero,重新实现国际象棋的MuZero和AlphaZero模型 项目os分为5个阶段(估算) 阶段1:重新输入在中开发的所有MuZero模型代码以进行介绍 阶段2:连接在阶段1中开发的代码以下象棋 阶段3:用C ++ / CUDA重写代码以提高性能 阶段4:更改网络模型和代码结构(C ++ / CUDA版本): (a)AdaGrad和ES用于反向传播 (b)用于预测神经网络的变压器 (c)从几步历史中学习,而不是全面学习 (d)使用cassandra作为重播缓冲区 阶段5:分布式学习 起始日期2021年4月18日


【文件预览】:
muzero_beginner-main
----tf_train_nncov.py(5KB)
----AlphaZero()
--------implementations()
--------AlphaMCTS.py(12KB)
--------AlphaCoach.py(3KB)
--------__init__.py(0B)
--------AlphaNeuralNet.py(3KB)
----muzero_coach.py(10KB)
----tf_train_nnsimple.py(4KB)
----tf_train_nnsimple_ll.py(5KB)
----muzero_main.py(8KB)
----tf_train_rl_basic.py(550B)
----LICENSE(34KB)
----tf_training_linear_models.py(5KB)
----MuZero()
--------implementations()
--------MuMCTS.py(11KB)
--------__init__.py(0B)
--------MyNeuralNet.py(13KB)
--------MuCoach.py(7KB)
----tf_training_embedding.py(7KB)
----.idea()
--------misc.xml(185B)
--------vcs.xml(180B)
--------muzero_beginner.iml(441B)
--------modules.xml(282B)
--------.gitignore(47B)
--------inspectionProfiles()
----tf_train_nncov_ll.py(6KB)
----.gitignore(2KB)
----tf_training_ensemble.py(3KB)
----README.md(771B)

网友评论