文件名称:DeepStack.pdf
文件大小:320KB
文件格式:PDF
更新时间:2023-02-01 14:17:46
人工智能 cfr
近年来,人工智能取得了几项突破,游戏往往成为里程碑。这些游戏的一个共同特点是玩家拥有完美的信息。扑克是不完全信息的典型博弈,是人工智能中一个长期存在的挑战问题。DeepStack,一种不完全信息设置的算法。它结合递归推理来处理信息不对称,分解来集中计算相关决策,以及一种通过深度学习从自我游戏中自动学习的直觉形式。在一项涉及44000手扑克牌的研究中,DeepStack击败了具有统计意义的专业扑克玩家,他们在德州扑克中的头脑是无限的。这种方法在理论上是合理的,并且比以前的方法更难开发策略。