优势策略均衡是由每个参与人的优势策略所组成的策略组合,这个概念通常在一般意义上的囚徒困境博弈中可以体现。
囚徒困境
两名囚犯:行与列,正在被隔离审讯之中,若两人都坦白,则每人入狱8年;若两人都抵赖,则每人入狱1年;若其中一个人坦白,则他被放掉,另一人入狱10年。
列
抵赖 坦白
抵赖 -1,-1 10,0
行
坦白 0,10 -8,-8
在终的策略中,优势策略为(坦白,坦白),当然,囚犯会考虑到双方坦白都完蛋,但是,对于罪犯来说,坦白是它们的唯一优势策略,尽量看起来似乎双方抵赖得到的囚犯得到损失将会最小,但其中一方的坦白提供了比双方抵赖更大的激励,对于其中一个囚徒来说,他面临的片面的观察角度,如下的规则所示:
1、如果我抵赖,对方也抵赖,我会被关一年
2、如果我抵赖,对方坦白,我会被关十年
3、如果我坦白,对方没有坦白,我可能被放掉
4、如果我坦白,对方也坦白,我会被关八年
最理想的是1,但我不知道对方是否会坦白,我抵赖,1年或10年,我坦白,放掉或8年。
然后考虑对方的情况,有如下的结果:
对方抵赖,我坦白时,我可能被放掉。
对方坦白,我坦白时,我可能被关八年而不是十年。
对方抵赖,我抵赖时,我可能被关一年。
对方坦白,我抵赖时,我可能被关十年
结论:我抵赖时,无论如何也要进*,而如果我坦白,则有可能被放掉,或者只被关八年而不是十年,所以我应该坦白。
合作博弈与非合作博弈
在囚徒困境中,如果两个囚犯可以做决定之前通气,这就涉及到了合作与非合作博弈的范畴。
一般合作性博弈是公理性的,常常诉诸于帕累托最优、公平与公正等。非合作博弈相比之下,有经济上的特点,它的均衡概念是建立在参与人在给定的约束的条件下的最大化其自身的效用函数的基础上的。通常,非合作博弈更常见,如寡头定价、拍卖出价、推销员的努力、政治上的讨价还价。
这里不考虑两者通气的情况。
合作博弈与非合作博弈有如下的描述:
无冲突的合作博弈:大家针对相同的问题,采取合作解决的态度
有冲突的合作博弈:垄断的卖方与垄断的买方间的谈判
有冲突的非合作博弈:囚徒困境
无冲突的非合作博弈:两家公司在争夺一个市场时,面对不景气的市场共同采取的策略。
俾斯麦海战
一般情况下,只有很少的博弈有优势策略均衡,但有时候它也是有用的,虽然它不能很让建模者轻易地判断出结果。
俾斯麦海战发生在1943年的南太洋上,日本海军上校木村受命将日本陆军运往新几内亚,中间要通过俾斯麦海->新几内亚的航线:较短的北线与较长的南线,木村必须选择一条。而肯尼则必须决定将其飞机派往何处去搜索日军,肯尼如果派错了地方,则可以收回飞机,但要减少轰炸天数。
参与人:木村,肯尼
行动集均为{北,南},但支付是不同的,博弈如下所示:
木村
北 南
北 2,-2 2,-2
肯尼
南 1,-1 3,-3
这里没有优势策略,因为肯尼认为木村在北,他就去北,如果肯尼认为木村在南,他就去南。
看起来很像一个捉迷藏的游戏。
根据更好法则(弱优势概念):对于参与人的策略来说,如果还存在另外的一个比这个更好的策略,并且它的所有参与人策略与其它策略的组合都不比参与人的当前策略差的情况下,则可以认为参与人的当前策略比另一个策略稍差。
这里要注意的是:概念要关注在稍差上,进行逐步排除,而不是关注在稍好上进行选择。
比如,肯尼选择南,则有{1,-1),(3,-3)两个结果,如果选择北,则有{2,-2),(2,-2)这两个结果。
对于肯尼来说,选择南还是北都有支付,此处如果以肯尼为中心来进行选择,是无法获得结果的。
然而,对于木村来说,选择南有(2,-2)(3,-3),选择北有(2,-2),(1,-1),则可以发现,木村选择南是较弱的策略,这里木村就应该选择北。肯尼经分析后,于是向北进攻,这也是1943年所发生的真实情况。
博弈的结果只可以作为一个参考值,要做到料敌先机,就必须做到知已知彼,如果对方是一个只考虑那一种优势更好的策略,则可以顺其道而行之。
博弈论一般建立在各参与人理性选择的结果绝不是严格劣势策略的基础之上,所以在判断出结果的时候,一定要注意,有时候采用非理性的行为可以达到搅乱对方的目的。
俾斯麦海战是一个零和博弈,一方所得恰好是另一方所得减少的,它虽然是一个很有意思的博弈,但在实际的经济学行为中并不多见,因为往往有第三方因素破坏该博弈的单纯性,比较离婚的夫妇为分割财产不得不付钱给律师,造成支付总额的减少。