deep-reinforcement-learning:进行深度强化学习纳米学位课程的回购。 包括

时间:2024-04-23 12:34:14
【文件属性】:

文件名称:deep-reinforcement-learning:进行深度强化学习纳米学位课程的回购。 包括

文件大小:15.35MB

文件格式:ZIP

更新时间:2024-04-23 12:34:14

JupyterNotebook

深度强化学习纳米学位 该存储库包含与Udacity的“ 计划有关的材料。 目录 讲解 这些教程将引导您实现强化学习中的各种算法。 所有代码都在PyTorch(v0.4)和Python 3中。 :实现动态编程算法,例如策略评估,策略改进,策略迭代和值迭代。 :实施蒙特卡洛方法进行预测和控制。 :实施时差方法,例如Sarsa,Q-Learning和Expected Sarsa。 :了解如何离散化连续状态空间,以及解决Mountain Car环境。 :实现离散化连续状态空间的方法,以实现更好的泛化。 :探索如何使用深度Q网络(DQN)导航航天器而不会坠毁。 :使用C ++ API从3D虚拟机器人仿真中训练强化学习代理。 (外部链接) :使用具有自适应噪声缩放功能的爬坡来平衡移动小车上的杆。 :使用交叉熵法训练汽车在陡峭的山坡上行驶。 :了解如何使用蒙特卡洛政策渐变,解决了经典


网友评论