文件名称:PILCO:Tensorflow中的贝叶斯强化学习
文件大小:163KB
文件格式:ZIP
更新时间:2024-05-30 17:16:34
machine-learning reinforcement-learning tensorflow gaussian-processes model-based-rl
学习控制的概率推理(PILCO) TensorFlow v2 算法的现代化实现。 与PILCO以独立的MATLAB包编写的方式不同,该存储库旨在通过大量使用现代机器学习库来提供干净的实现。 特别是,我们使用TensorFlow v2避免了对硬编码渐变的需求,并可以扩展到GPU架构。 此外,我们将用于高斯过程回归。 核心功能已针对原始MATLAB实现进行了测试。 使用例 在使用PILCO之前,您必须通过运行以下命令进行安装: git clone https://github.com/nrontsis/PILCO && cd PILCO python setup.py develop 建议使用python>=3.7在全新的conda环境中安装所有内容 此回购中包含的示例使用和 。 这些依赖关系应手动安装。 然后,您可以运行以下示例之一 python examples/inverted
【文件预览】:
PILCO-master
----setup.py(1KB)
----.gitignore(100B)
----requirements.txt(76B)
----.travis.yml(225B)
----LICENSE(1KB)
----pilco()
--------__init__.py(69B)
--------controllers.py(5KB)
--------models()
--------rewards.py(3KB)
----examples()
--------linear_cars_env.py(1KB)
--------inv_double_pendulum.py(3KB)
--------swimmer.py(4KB)
--------utils.py(2KB)
--------inverted_pendulum.py(1KB)
--------pendulum_swing_up.py(3KB)
--------Hyperparameter setting and troubleshooting tips.ipynb(171KB)
--------safe_swimmer_run.py(5KB)
--------mountain_car.py(3KB)
--------safe_cars_run.py(5KB)
----safe_pilco_extension()
--------__init__.py(0B)
--------README.md(377B)
--------safe_pilco.py(2KB)
--------rewards_safe.py(3KB)
----README.md(2KB)
----tests()
--------test_sparse_predictions.py(2KB)
--------test_cascade.py(3KB)
--------__init__.py(0B)
--------test_rewards.py(786B)
--------Matlab Code()
--------test_controllers.py(3KB)
--------test_predictions.py(2KB)
----.coveragerc(203B)