文件名称:angry-ai:Unity机器学习代理制作的Battle Robots演示
文件大小:420.14MB
文件格式:ZIP
更新时间:2024-05-25 07:25:15
C#
愤怒的AI- 这是一个由进行的小型机器人战斗模拟。 每个机器人由两个强化学习代理控制,这两个强化学习代理已接受PPO的连续培训。 对于下层代理(“行者”),我首先创建了演示文件,记录了由振荡器产生的启发式动作。 然后,使用强度设置为1.0且启用了use_actions选项的GAIL奖励信号,对代理进行了模拟这些动作的培训。 添加行为克隆,强度为0.5。 外在奖励信号的强度设置为0.1,事实证明该强度足以学习如何从随机启动旋转中恢复(演示中未包括)。 这个第一个训练阶段应该执行10到1500万步之间的步幅-足以使代理模仿振荡器的运动,但又不能太长,以防止策略过度拟合。 在第二个训练阶段,我将目标速度随机化。 现在删除了GAIL和行为克隆信号,并将外部奖励的强度设置为1.0。 在最后的第三阶段中,还对步行和观看方向进行了随机化,以概括该策略。 在训练阶段之间,我还稍微增加了地面的摩擦力。