文件名称:Reiforcement-Learning-Udacity-p1---Navigation
文件大小:464KB
文件格式:ZIP
更新时间:2024-03-28 18:52:31
JupyterNotebook
项目1:导航 介绍 该项目包含Udacity深度强化学习的第一个项目的解决方案。 提供+1的奖励以收集黄色香蕉,提供-1的奖励以收集蓝色香蕉。 因此,代理商的目标是尽可能多地收集黄色香蕉,同时避免使用蓝色香蕉。 状态空间具有37个维度,并包含主体的速度以及围绕主体向前方向的物体的基于光线的感知。 有了这些信息,代理就必须学习如何最好地选择动作。 提供了四个离散操作,分别对应于: 0向前移动。 1向后移动。 2向左转。 3向右转。 该任务是情节性的,并且为了解决环境,您的特工必须在100个连续情节中获得+13的平均得分。 入门 从下面的链接之一下载环境。 您只需要选择与您的操作系统匹配的环境即可: Linux: Mac OSX: Windows(32位): Windows(64位): (对于Windows用户)如果您需要帮助来确定您的计算机运行的是Windows操作系统的
【文件预览】:
Reiforcement-Learning-Udacity-p1---Navigation-main
----Images()
--------p1_1.png(69KB)
--------1(2B)
----dqn_agent_6_101.py(6KB)
----model_6_101.py(1KB)
----checkpoint.pth(393KB)
----Navigation.ipynb(45KB)
----report.md(2KB)
----README.md(4KB)