OPE-tools:基于离岸政策评估报告实证研究的OPE工具

时间:2024-05-24 13:03:05
【文件属性】:

文件名称:OPE-tools:基于离岸政策评估报告实证研究的OPE工具

文件大小:15.35MB

文件格式:ZIP

更新时间:2024-05-24 13:03:05

Python

OPE工具 基于对政策外政策估计的实证研究的OPE工具( ) 安装 请使用Python 3.6+。 pip install -r requirements.txt pip install -e . 用法 要在论文中复制结果,请参阅paper.py中的说明 要运行自己的实验,请参见example.py(或example2.py)。 或者,您可以将paper.py修改为您的用例。 目标 我想使此存储库对社区尽可能有用,这意味着要将其存储到模块化,更像包装的地方还需要做大量的工作。 非常感谢您的帮助。 引用OPETools 如果您使用OPETools,请使用以下BibTeX条目。 @misc{voloshin2019empirical, title={Empirical Study of Off-Policy Policy Evaluation for Reinforcemen


【文件预览】:
OPE-tools-master
----setup.py(328B)
----.gitignore(89B)
----requirements.txt(301B)
----example2.py(3KB)
----ope()
--------openai()
--------trained_models()
--------base_policy_methods()
--------__init__.py(0B)
--------models()
--------.DS_Store(10KB)
--------experiment_tools()
--------envs()
--------utls()
--------algos()
----run_paper_aws.py(35KB)
----example.py(3KB)
----README.md(1KB)
----experiment_runner.sh(22B)
----paper.py(76KB)
----cfgs()
--------toy_graph_pomdp_cfg.json(344B)
--------base_enduro_cfg.json(403B)
--------base_mc_cfg.json(367B)
--------base_toy_graph_cfg.json(405B)
--------base_pixel_mc_cfg.json(370B)
--------base_breakout_cfg.json(401B)
--------base_pixel_gridworld_cfg.json(406B)
--------base_toy_mc_cfg.json(405B)
--------base_gridworld_cfg.json(378B)
--------base_baird_cfg.json(370B)

网友评论