第7章 情侣博弈与智猪博弈(1)
先动与后动
在任何一局博弈中,参与者采取行动的顺序对于博弈竞局的结果有着极其重要的影响。同样的策略选择,行动的先后顺序不同,博弈的结果也就不同。
至于是先下手为强,还是后来者居上,就不可一概而论了,而是由博弈参与者身处的具体情形所决定的。
怎样让恋人百依百顺?
博弈无处不在,连卿卿我我的情侣之间也不例外,并且还有一个专门的博弈名称——情侣博弈。情侣博弈原来的标准说法是性别之战,也有人翻译为夫妻博弈。它与我们前面介绍的博弈类型有所不同,在这一博弈中,先采取行动的一方参与者往往更有优势。
情侣还讲什么博弈?你可能会发出这样的疑问。其实,即使是情侣,双方的爱好或者偏好还是不相同的。情侣博弈讲的就是如胶似漆的甜蜜情侣因偏好差异而引起的对局形势,利益关系方面大同小异的这么一种情况。
张森和刘荔是一对热恋中的情侣,由于不在同一个城市工作,平时很少有机会在一起共度浪漫时光,只有周末两个人才可以聚在一起。难得的周末又到了,安排什么节目好呢?
这个周六晚上电视里要转播一场拳王争霸赛,刘易斯、霍普金斯等重量级选手都将参加。张森是个超级健身迷,大型拳击赛事他从来都不会错过。
也正好是这个周六的晚上,俄罗斯一个著名歌剧团来到了该市,演出柴可夫斯基的歌剧《天鹅湖》。刘荔最喜欢歌剧、钢琴等高雅艺术,她岂肯放过自己最崇拜的偶像——柴可夫斯基的《天鹅湖》呢?
如果张森和刘荔是毫无关系的两个陌生人,那么这个问题就很好解决:张森在家里看拳王争霸赛,刘荔去歌剧院看歌剧演出就得了。可问题就出在他们是热恋中又时常不见面的情侣,分开度过难得的相聚日,恐怕是他们最不乐意的事情。那么,怎样安排周六的节目呢?张森和刘荔就面临着一场如何做出选择的博弈。
我们不妨定量地对他们进行分析:
如果两人都待在家中看拳王争霸赛,张森的满意度最高,设为2。刘荔没能看成自己喜欢的歌剧,本来满意度应设为0,但因为能和心爱的恋人待在一起,满意度就由0变为了1。
如果两人一起去歌剧院看演出,刘荔的满意度最高,也设为2。而张森因有恋人刘荔的陪伴,由看不成拳王争霸赛的满意度为0而变为了1。
如果张森留在家中看拳王争霸赛,而刘荔去歌剧院看演出,虽然双方各取所需,但因为分开过难得的周末,所以双方的满意度都设为0。
还有一种应该不会出现的可能情况:就是刘荔在家看拳王争霸赛而张森去歌剧院看演出,但这里还是把它写出来,设双方的满意度都为-1。
对张森来说,假如刘荔在家看拳王争霸赛,自己也看拳王争霸赛的满意度为2,而自己去歌剧院看歌剧的满意度为-1——在家看拳王争霸赛合算;假如刘荔执意要去歌剧院看歌剧,自己也看歌剧的满意度为1,而自己留在家中看拳王争霸赛的满意度为0——去歌剧院看歌剧合算。
由此可知,张森没有“不论刘荔采取什么策略,我采取这个策略总比采取别的策略更好”的严格优势策略,刘荔决定去歌剧院看歌剧或者在家看拳王争霸赛,他的最佳选择就是陪着,即自己的最优策略取决于对方的选择。
同样的道理,刘荔也没有严格优势策略,张森决定在家看拳王争霸赛或者去歌剧院看歌剧,她的最优选择也是陪着。
很显然,在情侣博弈中,双方都留在家中看拳王争霸赛或者都去歌剧院看歌剧,就是博弈的两个纳什均衡,即对整体而言,双方满意度最高的两个结局。但最后结局究竟会落实到哪一个纳什均衡,这是博弈论本身尚且没有解决的问题。虽然这样的结局对个体来讲不是最优的,但自己的少许让步却可以换来情侣组合整体的最佳满意度,同时这也是自己相对较佳的满意度。一旦处于这样的位置,任何一方都不想单独改变策略,因为单独改变没有好处,其结果是缺少情侣的陪伴,造成整体满意度的急剧下跌。
常言道“先下手为强。”情侣博弈的结果在大多数情况下会体现出先动优势,即先采取行动的一方会占据一些优势,获益多一些。
比如,在两人还没有商量周六安排的情况下,刘荔先打电话给张森说:“亲爱的,我最爱看的《天鹅湖》周六晚上在歌剧院上映,我们一起去看好不好?”他们是热恋中的情侣,既然刘荔已经抢先自己一步提出了去看歌剧,张森还会坚持看拳王争霸赛而扫恋人的幸吗?肯定不会的。
反过来,如果是张森先打电话给刘荔说,想跟她一起看拳王争霸赛,刘荔也同样不会驳张森的面子,而自私地非拉他去看歌剧不可。
三个和尚为什么没水吃?
博弈论里有一个十分卡通化的博弈模型,叫做智猪博弈。它所讲述的故事情节大概是这样的:
猪圈里有两头猪:一头大猪,一头小猪。猪圈设计得很长,在猪圈的一端是猪食槽,另一端安装有一个踏板,用以控制猪食的供应。猪每踩一下踏板,猪圈另一端的猪食槽就会落下10个单位的食物,供两头猪食用。
但是猪在踩踏板后跑到食槽这段路程需要消耗相当于2个单位饲料所带来的能量。并且由于踏板远离猪食槽,踩踏板的猪将比另一头猪后到猪食槽前,从而也会减少其吃食的数量。
如果两头猪同时踩踏板,然后再一起跑到猪食槽前吃食,则大猪将会吃到7个单位猪食,小猪会吃到3个单位猪食,减去从踏板到猪食槽中间的劳动耗费各2个单位,大猪实得5个单位猪食,小猪净得1个单位猪食。如果大猪踩踏板,小猪在另一端的猪食槽等着先吃,大猪再赶过去吃,大猪会吃到6个单位猪食,小猪会吃到4个单位猪食。减掉大猪去踩踏板路途中付出的劳动耗费2个单位,大猪净得4个单位猪食,小猪由于没有去踩踏板,也就不存在劳动耗费,实得仍是4个单位猪食。
如果小猪踩踏板,大猪在另一端的猪食槽等着先吃,小猪在踩完踏板后再赶过去吃,大猪由于先吃,会吃到9个单位猪食,小猪只能吃到1个单位猪食,再减去踩踏板消耗的2个单位猪食,小猪是净亏损1个单位,即实得-1个单位猪食。
如果两头猪都选择等待,结果是谁都没有猪食可吃。两头猪的所得均是0。
智猪博弈的收益矩阵如下表所示:
智猪博弈小猪
踩踏板等待
大猪踩踏板5,14,4
等待9,-10,0
注:表中的数字表示在不同选择下每头猪所能吃到的猪食数量减去踩踏板的消耗之后的净收益。
那么,两头猪各会采取什么策略呢?不难得出,因为利益分配决定两头猪的理性选择:小猪踩踏板收获甚微(大猪也去踩踏板)或者是亏损1个单位猪食(大猪不去踩踏板),不去踩踏板反而得到4个单位的猪食(大猪也去踩踏板)或者是一无所得(大猪不去踩踏板)。对小猪来说,无论大猪会不会去踩踏板,自己不踩踏板总是最佳选择,于是,小猪将采取“搭便车”行为,舒舒服服地等在猪食槽边。
反观大猪,由于小猪有等待这个占优策略,即小猪是不会去踩踏板的。大猪此时若选择等待,一份猪食也得不到;选择踩踏板还会得到4个单位的猪食,所以,等待便是大猪的劣势策略,自己亲自去踩踏板总比不踩强吧,只好亲力亲为,不知疲倦地奔忙于踏板和食槽之间。
智猪博弈是一个“多劳不多得,少劳不少得”的均衡。它的结论是,在一个双方公平、公正、合理和共享竞争资源的环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。
在现实生活中,这种情况也比比皆是。很多人都争着做那只坐享其成的小猪,只想付出最小的代价,却想得到最大的回报。“一个和尚挑水吃,两个和尚抬水吃,三个和尚没水吃”说的正是这样一个道理。这三个和尚都想做不劳而获的“小猪”,不愿承担起“大猪”的义务,最终导致每个人都无法获得收益。
再比如,新开发的某种新产品的性能和功用还不被人所熟识,在其推广过程中,一般只有生产能力和销售能力都比较强的大企业才会花巨资进行铺天盖地的产品介绍活动和广告轰炸。出现这一结果的原因与智猪博弈故事的原理一样。
大企业是“大猪”,中小企业是“小猪”。作为“小猪”的中小企业完全没有必要做出头鸟,自己投入大量资本做产品宣传,而只要尾随“大猪”(大企业),待大企业的广告为产品打开销路,并逐步形成市场后,再推出类似产品进行销售,就能赚取一定的利润。这也是为什么占有更多资源者要承担更多义务的原因所在。
枪打出头鸟,刀砍地头蛇
某大学公开招聘两名教授,一名教授教经济学,另一名教授教会计学。经过层层考核,最终有甲、乙两人得此殊职。可招聘并未结束,好戏还在后头,接下来面对的是一个让所有人想不通,但现实得无法再现实的博弈决策过程。究竟是甲教经济学、乙教会计学呢,还是甲教会计学、乙教经济学?这个选择过程可以说让所有人都跌破眼镜,别急,让我细细为您道来。
在揭晓这个选择过程之前,我认为有必要为您简单地介绍一下甲、乙两位教授的教育背景、工作经验,以及现阶段为了生活,人人都十分关心的一件事情——教授不同科目的不同薪酬。
甲、乙两教授都具有相同的学历背景——会计学硕士学位。就教育背景来说,两人处在同一起跑线上。但就工作经验来看,两名教授都有经济学和会计学的教学经验,但甲教授的会计学经验要优于乙教授。
再说薪酬水平。由于种种原因,薪酬一直是所有员工比较敏感的话题,通常情况下被当作秘密来对待。当未确定谁教经济学、谁教会计学之前,学校为了避免两位教授的功利心理,达到各尽其才的目的,特对他们隐瞒了这一信息。
实际情况是,会计学教授的工资是5000元/月,而经济学教授的工资是3500元/月。造成这种差异的原因并不是说这两个专业哪个更热门,或是说这两个专业的教授的工作量有什么不同,而是这所大学准备重点发展会计学专业。
按照一般人的思维和想法,知识就是金钱,经验就是硬道理,甲教授理所当然地应获得会计学教授一职,殊不知最后结果正好相反。
学校特意对两位教授隐瞒了工资信息,但并不代表着两位教授都不知道。在甲教授与乙教授的职位竞争博弈中,乙教授通过关系,暗地里知道了经济学教授与会计学教授的工资标准,而且还了解到:鉴于招聘工作进行到目前这一进度,已不可能有新的竞争选手加入。所以,乙教授在与招聘负责人谈适合教哪门课程时,他极力否认自己具有经济学教学经验,甚至声称如果让他去讲授经济学就等于是误人子弟,自己宁可不要这份工作。
而不知内情的甲教授为了证明自己的能力全面,一开始就表明自己会计学和经济学都很擅长,还大谈特谈自己的经济学教学经验。事情发展到这一步,每个人都应该看出了门道,招聘工作已经处于收尾阶段,学校不可能重新进行一轮招聘,根据与他们的谈话情况,最终结果是乙教授获得了会计学教授一职,而甲教授教授经济学。
可见,有时全才不如专才,在向外界展示自己知识丰富的时候,隐而不露有时能获得更大的收益。用句很形象的话来描述,就是“枪打出头鸟,刀砍地头蛇”。一个很常见的现象就是任何一个企业内部都存在着各种各样的小团体,每一个团体代表着一部分人的利益,并且每个团体还会推选出各自的代言人。这些代言人实际上就是当他所在团体的集体利益与其他团体之间发生冲突时,积极行动的领头人。其所处的位置就相当于智猪博弈中的“大猪”。
代言人为争取集体利益的活动成功了,这个团体的其他成员就可以毫无风险地、名正言顺地坐享代言人的成果;如果活动失败了,这些躲在幕后的“小猪”们也可以发表一通我是受害者、被逼无奈之类的演讲,让那些勇于出头露面的“大猪”成为永远的替罪羔羊。
企业内部要避免这类问题的发生,关键是要加强员工的民主参与能力,让每一个员工都有合适的途径来表达自己的意见与建议,另外,还要加强老板的决策透明度。同时,老板还要有意识地培养员工的团队意识,尽量让小团体向大集体看齐,减少小团体对企业大组织的不良影响。
怎样让偷懒的员工不再“搭便车”?
在智猪博弈中,小猪等待、大猪踩踏板的结果是由故事的游戏规则所导致的。规则的核心指标是猪食槽每次落下的食物数量和踏板与落食口之间的距离。如果对这两个核心指标的设置进行改变,猪圈里还会出现上述的“小猪躺着大猪跑”的景象吗?小猪“搭便车”的现象会不会杜绝呢?
先看猪食增减方案:
改变方案一——猪食减量方案
每踩一下踏板,另一端猪食槽上方的落食口落下的猪食仅为原来的一半分量,也就是5个单位的猪食。其结果必定是小猪、大猪都不去踩踏板了。因为小猪去踩踏板,大猪就会在第一时间将食物吃完;大猪去踩踏板,由于猪食不多,小猪也将会吃掉大部分食物。谁去踩踏板,就意味着为对方做嫁衣,为对方贡献食物,所以谁也不会有踩踏板的激励了。
如果改变指标的目的是想让大猪、小猪都去踩踏板,那么很显然,这一激励制度的设计是失败的。
改变方案二——猪食增量方案
每踩一下踏板,落食口落下的猪食为原来的两倍,也就是20个单位的食物。这一改变方案的结果是小猪、大猪都会去踩踏板。谁饿了,谁就会去踩踏板。反正对方不可能一下子把食物吃完。大猪、小猪现在的生活状态就相当于物质丰富的共产主义社会,它们的竞争意识将不会得到任何提高。
对于激励制度的设计者来说,虽然两头猪都去踩踏板了,但成本(猪食量)却提高了一倍,而且因为不需要付出多少代价就可以得到所需食物,所以两头猪都不会有多少动力去增加踩踏板的数量,激励作用明显不足。
再看看移位方案,也就是缩短踏板与落食口之间的距离。
移位方案一——减量加移位
每踩一次踏板,落食口落下的猪食仅为原来的一半分量,即5个单位猪食,同时缩短猪食槽与踏板之间的距离,将猪食槽移到踏板附近。在这种情况下,小猪和大猪都会拼命地抢着踩踏板。等待者不得食,无论对小猪还是对大猪,等待都是它们的严格劣势策略,只有不停地踩踏板,才有源源不断的食物,并且每次落下的猪食差不多刚好消费完。
对于改变规则的设计者来说,这一方案是最好的选择。成本低(猪食量减为原来的一半),且收获大(达到了让两头猪都抢着踩踏板的目的)。
移位方案二——增量加移位
一般来说,只要缩短猪食槽与踏板之间的距离,用不着增加猪食投放量,大猪、小猪都会去踩踏板。但是,如果适当增量,小猪会长大,大猪会出栏,效益当然就会提高。