文件名称:ATLA_robust_RL:通过交替学习的对手(ATLA)框架进行稳健的强化学习
文件大小:56.34MB
文件格式:ZIP
更新时间:2024-06-14 13:11:22
reinforcement-learning deep-reinforcement-learning reinforcement-learning-algorithms adversarial-examples robust-machine-learning
健壮的强化学习和经验丰富的对手的交替训练(ATLA) 该存储库包含一个参考实现,用于交替训练已学习的对手(ATLA),以针对状态观察的对抗攻击进行健壮的强化学习。 我们的ATLA训练程序可能有点类似于监督学习的“对抗训练”,但是我们基于 ,该过程表征了RL代理的最佳对抗攻击。 在训练过程中,我们会按照最佳的攻击方式与对手一起学习对手。 代理必须在训练期间击败这个强大的对手,从而在测试期间变得强大,可以抵抗各种强大的攻击。 先前的方法不是基于SA-MDP,而是在训练过程中使用了基于梯度的攻击试探法,这些试探法不够强大,并且在强大的测试时间攻击下变得脆弱。 遵循SA-MDP,我们可以找到最佳对抗攻击,通过解决转换后的MDP,可以在给定代理和环境的情况下获得最低的报酬。 这可以类似于分类问题中的最小对抗性示例()。 在DRL设置中,可以使用任何DRL算法(例如PPO)来解决此MDP。 我们