对网上的博弈论划线法的总结如下。
完全信息静态博弈是指博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。它的均衡可以用纳什均衡,且每个完全信息静态博弈都存在这样的均衡。纳什均衡可以用划线法+支付矩阵来求得,但并不是所有的求解纳什均衡都可以用这个方法。
参与者位于支付矩阵的上部和左部,参与者的策略位于矩阵左部和上部,矩阵中的数值为组合策略对于参与者的利益值。
这里拿剪刀石头布博弈来说,支付矩阵如下图所示:
其中第一行第一列(0,0)表示参与者都选择锤头的策略对于两个参与者的利益都是0。
划线原理:假设除了最后一个参与者其他参与者都选定某个策略,最后一个参与者选择对他来说利益最大的策略,相应最大值下面划横线。划线方法:按列比较各行第一个分量; 按行比较各列的第二的分量; 分别在最大值下划线; 其实就是找双方赢得都最大的偶对 |
所以以第一行为例,对于第一行所有数据的第二个分量的最大值为1,在1下面画横线。对于两个分量都画了横线的数据就是双赢的情况,显然图中没有这样的数据,说明有些博弈通过划线法不能找出纳什均衡,这就是两个参与者划线方法。
那如果是3个参与者呢,如下图所示问题:
以博弈方3来划分为3个支付矩阵,上图是博弈方3在选择A的时候对应的支付矩阵。第一个和第二个分量的划线方法和之前的两个参与者划线方法一样,对每一列只看第一个分量,每一行只看第二个分量,找最大值划线。因为划线的实质就是假设某个参与者选择了某个策略,对于另一个参与者选择当前情况收益最大的策略。类似的原理,对于第三个分量划线的方法是:三个支付矩阵的同一格进行比较第三个分量,在最大值下面划线,这等价于在参与者1和参与者2都选定策略的情况下,对不同策略对应的利益值中选择最大值。