文件名称:counting-agents:我的硕士论文项目的回购
文件大小:8KB
文件格式:ZIP
更新时间:2024-04-17 17:55:03
Python
RL通讯号码 总体思路 想法是将学习枚举过程的问题框架为两个代理之间的通信问题。 代理需要就他们分别观察的两个场景的数量进行沟通,并共同解决一项任务,该任务需要准确计算场景中的对象数量,而又无法看到两个场景。 环境 体育馆式环境:env.obs(),env.step(action),env.reset(),env.reward() 最简单的观察:用二进制表示的对象: max_objects = 9 n_objects = random.randint(1,max_objects) dim = 4 obs = np.zeros((dim,dim)) obs.ravel()[np.random.choice(obs.size, max_objects, replace=False)] = 1 obs: array([[0., 0., 0., 1.], [1., 0., 0., 1.],
【文件预览】:
counting-agents-master
----src()
--------__pycache__()
--------README.txt(290B)
--------ConvLSTM.py(7KB)
--------dnn_model.py(299B)
----notebooks()
--------dnn_model.ipynb(2KB)
--------README.txt(133B)
----README.md(3KB)
----environment.yml(56B)