文件名称:seed_rl:种子RL
文件大小:16.68MB
文件格式:ZIP
更新时间:2024-06-15 05:17:06
impala gcp tf2 rl deepmind-lab
种子 该存储库包含分布式强化学习代理的实现,其中对学习者进行了训练和推断。 实现了四个代理: 实现以下算法: 该代码已经与以下环境接口: 但是,可以使用使用任何强化学习环境。 有关该体系结构的详细说明,请阅读我们的论文。 如果您在工作中使用此存储库中的代码,请引用该论文。 比比克斯 @article{espeholt2019seed, title={SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference}, author={Lasse Espeholt and Rapha{\"e}l Marinier and Piotr Stanczyk and Ke Wang and Marcin Michalski}, year={2019}, eprint={191