文件名称:banana_navigator:Udacity的深度强化学习纳米学位的第一个项目
文件大小:168KB
文件格式:ZIP
更新时间:2024-03-06 02:59:50
Python
项目1:导航 介绍 这是我为Udacity的“深度强化学习纳米学位”所做的第一个项目,在该项目中,我训练了一个特工来导航一个世界,收集黄色而不是蓝色的香蕉。 这是Udacity对项目环境的描述: 提供+1的奖励以收集黄色香蕉,提供-1的奖励以收集蓝色香蕉。 因此,代理商的目标是尽可能多地收集黄色香蕉,同时避免使用蓝色香蕉。 状态空间具有37个维度,并包含主体的速度以及围绕主体前进方向的对象的基于射线的感知。 有了这些信息,代理必须学习如何最好地选择动作。 提供了四个离散操作,分别对应于: 0前进。 1向后移动。 2向左转。 3向右转。 该任务是情节性的,并且为了解决环境,您的代理必须在100个连续情节中平均得分为+13。 入门 从下面的链接之一下载环境。 您只需要选择与您的操作系统匹配的环境: Linux: Mac OSX: Windows(32位): Windows
【文件预览】:
banana_navigator-master
----weights.pth(8KB)
----agent.py(5KB)
----python()
--------learn.py(4KB)
--------trainer_config.yaml(4KB)
--------tests()
--------unityagents()
--------Basics.ipynb(6KB)
--------requirements.txt(160B)
--------setup.py(874B)
--------unitytrainers()
--------curricula()
--------README.md(273B)
--------communicator_objects()
----q_network.py(489B)
----banana_navigator_report.pdf(42KB)
----Navigation.ipynb(95KB)
----.gitignore(1KB)
----README.md(3KB)
----dueling_q_network.py(952B)
----.vscode()
--------settings.json(64B)