PokerRL:扑克中多智能体深度强化学习的框架

时间:2024-02-25 16:38:38
【文件属性】:

文件名称:PokerRL:扑克中多智能体深度强化学习的框架

文件大小:325KB

文件格式:ZIP

更新时间:2024-02-25 16:38:38

framework research reinforcement-learning poker deep-learning

扑克RL 扑克游戏中的多智能体深度强化学习框架。 背景 解决不完善的信息游戏的研究主要围绕直到最近才遍历整个游戏树的方法(例如,请参见 , , )。 神经虚拟自我播放(NFSP) ,后悔策略梯度(RPG) ,深反事实后悔最小化(Deep CFR) 和单深CFR 等新算法最近将深(强化)使用常规方法(例如CFR和虚拟游戏)进行学习,以仅在访问游戏状态的一小部分时即可了解近似的纳什均衡。 PokerRL框架 PokerRL算法的组成部分 您的算法由相互交互的工作人员(绿色)组成。 训练运行的参数通过TrainingProfile的实例( .../rl/base_cls/Training


网友评论