sequential_social_dilemma_games:回购可再现连续的社会困境

时间:2024-06-03 06:30:18
【文件属性】:

文件名称:sequential_social_dilemma_games:回购可再现连续的社会困境

文件大小:1021KB

文件格式:ZIP

更新时间:2024-06-03 06:30:18

Python

顺序社会困境游戏 此仓库是DeepMind的顺序社会困境(SSD)多主体游戏理论环境的开源实现。 可以将SSD视为类似于在空间和时间上扩展的《囚徒困境》游戏。 奖励结构造成了两难选择,因为个人的短期最优策略导致该小组的长期结果很差。 所实现的环境的结构与以及兼容 实作游戏 清洁:公共物品的困境,代理商会因食用苹果而获得奖励,但必须使用清洁束来清洁河流,以使苹果得以生长。 当代理商正在清理河水时,其他代理商可以通过食用出现的苹果来开发河流。 收获:一场悲剧般的两难困境,其中苹果的再生速度取决于附近苹果的数量。 如果单个代理商通过贪婪地食用过多的苹果而采用了剥削策略,那么所有代理商的集体奖励就会减少。 上图显示了清理(A)和收获(B)的经验Schelling图(来自 )。 这些图显示了给定正在协作的其他代理的数量,如果单个代理遵循缺陷/剥削策略(红色)相对于合作策略(蓝色),则可以期望得


【文件预览】:
sequential_social_dilemma_games-master
----setup.py(85B)
----.gitignore(1KB)
----images()
--------harvest.png(199KB)
--------cleanup_collective_reward.svg(877KB)
--------schelling.png(75KB)
--------harvest_collective_reward.svg(853KB)
--------cleanup.png(22KB)
----utility_funcs.py(4KB)
----ray_uint8_patch.sh(2KB)
----requirements.txt(748B)
----pyproject.toml(174B)
----__init__.py(0B)
----.travis.yml(289B)
----profiling()
--------profile_env.py(532B)
--------profile_train.sh(599B)
--------profile_env.sh(77B)
----.pre-commit-config.yaml(433B)
----models()
--------moa_lstm.py(3KB)
--------__init__.py(0B)
--------moa_model.py(17KB)
--------scm_model.py(10KB)
--------common_layers.py(2KB)
--------baseline_model.py(4KB)
--------actor_critic_lstm.py(3KB)
----.isort.cfg(179B)
----LICENSE(1KB)
----ray_autoscale.yaml(4KB)
----requirements_autoscale.txt(118B)
----run_scripts()
--------run_moa_cleanup.sh(646B)
--------run_baseline_cleanup.sh(465B)
--------cluster()
--------run_moa_harvest.sh(648B)
--------run_scm_harvest.sh(749B)
--------train_multiple_experiments.py(2KB)
--------README.md(2KB)
--------run_scm_cleanup.sh(747B)
--------run_baseline_switch.sh(445B)
--------run_baseline_harvest.sh(466B)
--------train.py(13KB)
----visualization()
--------__init__.py(0B)
--------visualizer_rllib.py(18KB)
--------rollout.py(4KB)
--------render_checkpoints.py(2KB)
--------plot_results.py(14KB)
--------run_script_to_latex_tables.py(3KB)
----README.md(7KB)
----social_dilemmas()
--------__init__.py(0B)
--------maps.py(2KB)
--------envs()
----tests()
--------__init__.py(0B)
--------test_rollout.py(591B)
--------test_envs.py(64KB)
----config()
--------__init__.py(0B)
--------default_args.py(8KB)
----algorithms()
--------a3c_moa.py(6KB)
--------common_funcs_baseline.py(582B)
--------a3c_baseline.py(605B)
--------__init__.py(0B)
--------common_funcs_moa.py(11KB)
--------ppo_baseline.py(2KB)
--------impala_moa.py(8KB)
--------ppo_scm.py(4KB)
--------impala_baseline.py(816B)
--------common_funcs_scm.py(7KB)
--------ppo_moa.py(6KB)
----environment.yml(322B)
----.flake8(105B)
----docker()
--------Dockerfile(1KB)
--------readme.md(1KB)
--------build.sh(43B)

网友评论