文件名称:游戏中的战略教学-研究论文
文件大小:854KB
文件格式:PDF
更新时间:2024-06-30 01:26:42
learning in games
众所周知,在所有有限博弈中,存在导致纳什均衡的非耦合学习启发式。 玩家为什么要使用这种学习启发式方法,它们来自哪里? 我们表明,在玩家有动机采用的所有有限博弈中,不存在导致纳什均衡的解耦学习启发式,这将是“进化稳定的”或可以“自我学习”。 相反,玩家有动机战略性地教导这样一个学习对手,以确保至少获得 Stackelberg 领导者的回报。 当限制到通用游戏、两人游戏、潜在游戏、具有战略互补的游戏或 2 x 2 游戏的类别时,不可能的结果保持不变,其中学习被称为“好”。 更一般地说,它也适用于导致相关均衡、合理化结果、迭代可接受结果或最小限制集的非耦合学习启发式方法。 如果还考虑了此类之外的一些通用游戏,则仅限于“战略性微不足道”游戏的可能性结果将失败。