文件名称:phasic-policy-gradient:论文“阶段性政策梯度”的代码
文件大小:3.31MB
文件格式:ZIP
更新时间:2024-05-12 13:18:20
Python
状态:存档(代码按原样提供,预计不会更新) 阶段性政策梯度 这是使用培训代理的代码。 支持平台: macOS 10.14(Mojave) Ubuntu 16.04 支持的Python: 3.7 64位 安装 如果没有,您可以从获取miniconda,或者手动从安装依赖项。 git clone https://github.com/openai/phasic-policy-gradient.git conda env update --name phasic-policy-gradient --file phasic-policy-gradient/environment.yml conda activate phasic-policy-gradient pip install -e phasic-policy-gradient 重现和可视化结果 具有默认超参数的PPG(结果/