培训时长 | 362 |
授课对象 | |
授课方式 | 内训 |
这些纳什均衡战略最明显的一点就是它们不是惟一的,多种均衡的出现是因为纳什均衡弱于(即易于满足)支配战略均衡。后者要求一种行动,对于竞争者每一种可能的反应都是最优的;而纳什均衡要求一种行动,仅仅对于竞争对手的最佳回答反应是最优的。这是一种要求不太严格的均衡战略组合,因而易于满足。不过,这个信息并不能帮助解决百事可乐要宣布什么价格的问题,我们认为,无论是谁,在宣布一瓶饮料的价格时都不知道其对手宣布的价格。如果百事可乐认为可口可乐在一半时间内打折,一半时间内保持价格不变,那么百事可乐保持价格的期望值为10500美元,而百事可乐打折的期望值较低(只有10150美元)。这似乎表明百事可乐会偏好于保持高价格,但是,可以预见百事可乐保持高价会使可口可乐。单方违约而赚取16000美元,而百事可乐此时只能得到9000美元。百事可乐怎样才能避免这种最终获得9000美元的不利结果,而更有可能获得14000美元呢? 答案取决于百事可乐的随机定价过程,百事可乐必须算出什么样的自动定价反应将使可口可乐在保持高价和价格打折两者之间无差异,从而愿意随机宣布自己的价格。也就是说,百事可乐采取打折行动的概率为多大时,使可口可乐从保持高价和价格打折两种行动得到的期望收益相等。有趣的是,因为收益是不对称的,所以期望的概率不是0.5。让我们看一下答案是什么,用P和(1-p)分别代表百事可乐保持高价和打折的概率,我们计算 (p)$13000+(1-p)$10500=(p)$16000+(1-p)$8000(16-3)式中可口可乐的收益要按照表16-4的各列来安排,解出的概率p=0.454和(1-p)=0.546,达到了使可口可乐无差异的目标,因此其选择也具有不可预测的随机性。 不过要注意,存在一种与此解相联系的对照形象的纳什反射性。可口可乐面对一种可比较的收益结构和对百事可乐的战略两难境地,因此会希望知道保持高价和打折具有什么样的概率才能使百事可乐认为这两种选择是无差异的。与上面相同的计算是 p$12000+(1-p')$9000=(p)$14000+(1-p')$6300(16-4) 式中百事可乐的收益是按照表16-4的各行安排的。我们得到p'=0.574和(1-p')=0.426,如果百事可乐的随机选择是对可口可乐随机性的一种最佳回答反应,而且如果此时可口可乐不能做得更好,那么这种违约打折博弈必定具有第三个纳什均衡战略一即{百事可乐保持高价(p= 0.454),可口可乐保持高价(p'=0.574)丨,这一组战略被称为混合的纳什均衡战略。百事可乐确定保持高价的概率为0.454,打折的概率为0.546,将使可口可乐宣布的每一种价格战略形成11634美元的期望值。同样,可口可乐用0.574的概率保持高价和0.426的概率打折将使百事可乐宣布的每一种价格战略产生10720美元的期望值。因此,在此博弈的战略均衡中,存在着两种纯粹的和一种混合的纳什战略。 采取一种完全自动的机制来实施这种混合纳什战略(即用计算机手段来重复特定的不均匀硬币的投掷过程)是一种实施混合战略的方法,不过原则上这三种纳什均衡战略没有哪一种优于另外两种。在一次行动的报复折扣中,图所有四个方格的情况仍然会出现。右下角{6300美元,8000美元}的结果,左上角{12000美元,13000美元}的结果以及与两种纯粹纳什战略相对应的两种非对称结果有时也全都会出现。在没有加进事先沟通、没有转移支付和约束性协议的非合作性同时博弈中,完全没有办法避免这种可能战略均衡的多元性。因此实际上在报复折扣博弈中,这三种纳什战略中任何一种的一次行动都可能出现非常好或非常糟的结果。 当然,{12000美元,13000美元}是所有结果中最好的。我们在下节中将分析如何通过引进重复行动,不完全信息和可信性机制把这种同时博弈转换成一种顺序博弈来追求这种双赢的?