【文件属性】:
文件名称:phasic-policy-gradient:论文“阶段性政策梯度”的代码
文件大小:3.31MB
文件格式:ZIP
更新时间:2021-04-22 19:31:40
Python
状态:存档(代码按原样提供,预计不会更新)
阶段性政策梯度
这是使用培训代理的代码。
支持平台:
macOS 10.14(Mojave)
Ubuntu 16.04
支持的Python:
3.7 64位
安装
如果没有,您可以从获取miniconda,或者手动从安装依赖项。
git clone https://github.com/openai/phasic-policy-gradient.git
conda env update --name phasic-policy-gradient --file phasic-policy-gradient/environment.yml
conda activate phasic-policy-gradient
pip install -e phasic-policy-gradient
重现和可视化结果
具有默认超参数的PPG(结果/