Skip to content

磕磕绊绊,终于把《妙趣横生博弈论》读完,再看一眼封面,英文名也许更符合书中主旨《The art of strategy》(策略艺术),如作者所言,相对于科学,博弈论更像是艺术,既然是艺术,那就用理解艺术的方式学习吧!

最后的感叹来自第13章——激励,虽然第14章的案例同样精彩,但是未曾学过人力资源管理的我,也能感觉到激励对于薪酬设计的策略讲究,摘录几条如下(实用的策略必定更加复杂和规范,对这一主题感兴趣的朋友可以继续参考专业书籍)。

1.线性激励与非线性激励:

按照销售额的百分比提成,随着销售额的增加,提成同比例增长,这就属于线性激励;当销售额达到某一个下限点,才给予奖励,这种奖励就属于非线性激励。两种激励各有利弊,实际中采取组合方案。如:某人基本工资定额,然后按业绩定比例提成,业绩达到某种条件还有奖金。

2.效率工资:

给定的工资也许能刚好驱动雇员工作,但是雇员未必会努力工作,而偏偏是雇员的努力程度最难被雇主衡量,所以很多人“以结果导向”。通常可以假定雇员是努力工作,雇主为雇员的这种效率所支付的效率工资高于最低工资,但是雇主也会设定监督抽查机制,一旦发现与假定不符的行为,就会给予雇员惩罚。对于雇员而言,衡量偷懒所得与雇主惩罚之间的利害关系,就可以做出决定,同样,雇主制定惩罚的机制和力度也会基于此。当然,现实中,雇佣双方是否真是这种“理性人”的模型呢?

3.替代关系和互补关系:

雇员通常同时承担多项任务,这些任务之间为替代关系和互补关系。如:在玉米地和牛奶场工作的雇员,花在玉米地的时间多了,留在牛奶场地时间就少了,这就是替代关系;但是照看蜂箱和苹果园的雇员,养蜂越努力,种植苹果也会越有效率(我的理解是蜜蜂可以为苹果花授粉,当然,蜜蜂超过一定的量,养蜂努力也不会增加种苹果的效率。),这就是互补关系。

雇主为雇员安排工作时,当然要尽量分配给同一个雇员互补型的任务,不同雇员则承担替代型的任务,扩展后,一个公司的不同部门之间应该分别承担具有替代型的任务,同一个部门内则安排互补型的任务。呵呵,这一点说起来容易,实际操作恐怕复杂多了,想想看,每种任务/子任务之间,应该按照哪种方式划分才更合理?各种任务之间分别是什么关系?这些恐怕都不是那么容易解决的。

4.外在激励和内在激励:

更确切的说,是物质激励和精神激励。还是要针对工作任务首先定性,这类工作需要什么样的激励?有的工作就是需要用金钱和物质利益去激励,毕竟,人要生存;有的工作却需要发自内心的热爱或精神享受,同样,人不仅要生存。想起一段世俗法则:只有老板没钱的时候,他才会和你谈理想!呵呵~真的是这样吗?好像是,又好像不是~

5.层级组织:

大部分公司都是层级结构,总裁->总监->经理->主管->员工,甚至人与人之间的关系也是层级式的,是不是发现朋友虽然很多,经常交流的只有那么几个?层级结构便于管理,但是层与层的关系同样很微妙。当下属犯错会影响主管的考核时,主管莫不就是有包庇的激励?当下属绩效由主管决定时,“小团体”现象同样受到激励。如何制定合理有效的管理策略?监督惩罚是有效的策略吗?哦,好像已经超越了薪酬激励,已经牵涉到普通管理层面了。

6.多个所有者:

多头管理是一种什么结果?莫不就是相互抵消和制约?正如“一仆难侍二主……”当一个人同时被多个利益不同,甚至冲突的上司管理时,听哪一个的?想想工作中所遇到的情况吧!夹在中间真是痛不欲生啊……

----------------

全书到此读完,主要推荐前七章的基础原理部分,八至十四章只是策略应用和案例分析。当然,全书还是辩证的阅读比较合适,就像那位讲授《构建动态网站》的哈佛教授所表现的“这种方法的优点是……那它的缺点是?”所以,我觉得这本博弈书除了有些小编排错误以外,某些案例的讲解还是略显罗嗦,文字为主的表达形式欠直观,包括课后习题“健身之旅”的后面内容也比较牵强,也可能是由于翻译本身的原因吧,有的地方确实让人看的云里雾里,等到“书读百遍其意自现”的那一刻吧!

最后附书中总结的几条博弈法则:

  • 1.向前展望,倒后推理。
  • 2.假如你有一个优势策略,请照办。
  • 3.剔除所有劣势策略和绝非最优反应策略,不予以考虑,如此一步步进行下去。
  • 4.走完寻找优势策略或剔除劣势策略的捷径后,下一步就是在博弈表的所有单元格中,寻找同一单元格中互为最优反应的策略对,这就是该博弈的纳什均衡。
  • 5.在纯冲突博弈(零和博弈)中,如果让你的对手事先看清你的真实选择对你不利,那么你可以随机选择自己备选的纯策略而获益。你的混合比例应该是这样的:对手采取任何特定的备选纯策略,都不可能利用你的选择,即,当你以混合策略对付他的混合策略中任一纯策略时,你得到的平均盈利都相等。

为什么投票要超过三分之二?或者按照《妙趣横生博弈论》原书第12章——投票中的例子:(美国)宪法为什么会有效?(修订宪法需要超过三分之二的多数同意)如本书作者所言,这只是他们的一项发现,也许得票超过三分之二的规定还有其他渊源。这里,只是一起来看看作者精妙的发现吧!

案例:

一场大选中,现任者(I)正面临挑战者(C)的威胁。假设在直角坐标系中(针对不同的社会事件,如社会问题和税收问题,选民有两个独立立场变量,分别有自由和保守两个极端,由此社会问题和税收问题分别构成两个坐标轴,各自有自由和保守连个极端方向),所有的选民立场均匀分布。

  • 1.当所有选民立场的分布构成一个圆时,I将自己的立场置于圆心,就可以针对来自任何方向的C做出相同的抵御策略;
  • 2.当所有选民立场的分布构成一个三角形时,I只有将自己的立场置于重心,才可以针对来自任何方向的C做出相同的抵御策略;
  • 3.将选民的独立立场变量增多时,上述三角形从二维向高维扩展,本书作者(或者作者援引)发现,“在任何维度的所有凸集中,三角形(以及它的多维模拟)其实是一种最坏的(均匀分布下选民立场的分布形态)结果。”而“在所有凸集中,现任者通过把自己定位在重心处,可以保证至少得到1/e=1/2.71828≈36%的选票。”甚至当选民立场成正态而非均匀分布时,上述结论仍然成立。这意味着,只要I将自己的立场摆在重心,则不论C如何更改自己的立场,I都能获得至少36%的选票;而C只有获得超过64%的选票才能代替I,或者说现状。

注:对于集合中的任意两点,连接这两点的线段也在集合内,则该集合为凸集。

真是令人惊奇!2/366.7%,这个数字大于并且接近64%,难道真的是巧合?理论上,真的是获得超过三分之二的投票(挑战者得票不仅超过64%,而且要超过66.7%),改变现状才是稳定的吗?呵呵~至少,本章认为“这样也许可以解释美国宪法的稳定性。”

我不得不收回昨天的话,因为《妙趣横生博弈论》(策略的艺术)第11章针对讨价还价的探讨,多少具有一定的实际意义,在正式的场合,讨价还价的策略就是“谈判的策略”,谈判专家到底是怎么做的?也许本章的内容能带来一点启发,也许这已经是用烂的市井手段,无论如何,总结下来不是坏事。

谈判的步骤:

  • 1.收集所有对自己有利的信息,抓紧所有对自己有利的条件,采取所有对自己有利的行动;
  • 2.分别站在自己和对方的立场,尽可能寻找谈判可能面临的事件和对抗策略,确定自己的底线,并评估对方的底线,最后将对自己最有利的方案适度延伸后作为谈判方案;
  • 3.开始参与谈判。

说起来真简单,这样的步骤太粗糙,甚至没有营养。嗯,必须承认,了解以上步骤还远远不能成为一位谈判专家,但是,从以上步骤出发,多少可以整理第11章的内容。以下针对上述三点,分别以ABC项说明。

A.倘若谈判协议无法达成,对于获益较多的一方显然损失更小(协议无法达成的情况下,各方的最大收益分别成为各自的最佳协议替代方案)。所以,谈判之前,利用自己所掌握的信息、借助的条件、做出的行动的,使自己的获益最大化(至少是令对方相信),就可以在谈判过程中处于有利地位。

B.各方之所以愿意坐下来谈判,就是因为达成协议后,各方所获取的利益都会比不达成协议多,至少,谈判的目标是如此。所以,想达成谈判协议,按照书中的逻辑,基于所有人最佳协议替代方案基础上的“利益馅饼”(即以各方达成协议后的整体获益,减去未达成协议情况下各方的最佳协议替代方案获益),对这个利益馅饼进行平分是最公平的方法。

*援引书中的例子:酒店的管理层和工会之间要为每天1000美元的利益进行谈判(双方合作,则每天一共获利1000美元,否则为零。),如果工会工人在罢工的同时能通过外出打工每天获得300美元,管理层也可以动员非工会工人每天产出500美元。这里,300美元和500美元分别是工会和管理层的最佳协议替代方案,而1000-500-300=200美元则是最后的利益馅饼

平分利益馅饼是最公平的方法,却未必是对自己最有利的方法,对己方而言,从各种可能的利益分配方案中挑出使自己获益最大的方案,显然是对自己最有利的。然后,为该方案准备充分的依据,在谈判桌前,通过讨价还价,最后落脚到平分利益馅饼的方法,至少不是一个吃亏的方案。

因为没人相信谈判各方会老老实实追求公平分配,在不确定其他各方选择的情况下,将公平分配向前推进到对自己足够有利的地步,再逐步后退,也会让其他各方感受到自己谈判的诚意,特别地,确定自己的底线、估计对方的底线等等,也都是为自己利益最大化而服务的。最后,“讨价还价”文化虽然可笑,但是现实就是如此,记得《无价》这本书中也反映着相似的思想。

C.呃,这已经是谈判的正式场合了,原书毕竟不是专门教授谈判技巧的,所以这里没有看到更多的思考,真的对谈判感兴趣,咱还需要再看看专业书哦!

相对于那本《写给中国人的经济学》,这本《妙趣横生博弈论》对纳什均衡的介绍显然更清楚,自然也更容易理解。原书第4章——美丽的均衡中第85页开始如此写到:“如果有这样的博弈结果,即,给定关于对方行动的信念,每个参与者的行动是其对其他人行动的最优反应,而且每个参与者的行动与对方关于其行动的信念是一致的,那么这类博弈结果就可以巧妙地解开‘我认为他认为’的循环。这样的结果有一个非常好的名号,叫参与人思维过程的静止点,或者叫做博弈的均衡。是的,这正是纳什均衡的定义。”

嗯,只看这段话根本不知道什么是纳什均衡,更具体的例子才能让人理解。这里不纠结什么是纳什均衡,只针对书中一例,说说怎么寻找纳什均衡点,因为我对于后文所介绍的“逐步剔除法”不是很理解,我喜欢的方法和再后面99页的连续数值的方法更相似一些。

原例如下(简化):

两个存在竞争关系的衬衫生产公司彩虹之巅(RE)和比比里恩(BB)要为自己生产的衬衫定价,他们生产一件衬衫的成本都是20元,当两家公司都定价42元时,分别可以销售出1960件,于是,他们分别可以获得的利润为(42-20)×1960=43120元。

现在开始,一家公司每降低1元,如果另外一家公司维持原价,降价的公司就可以多获得100个新客户,其中,20个是新增加的边际顾客,另外80个顾客是从维持原价的公司争取过来的;但是,如果另外一个公司也降低了1元,先降价的公司就没法争取到那80个顾客,取而代之的是,两家公司都分别增加20个边际顾客。

将两个公司的衬衫定价按照1元的减少量,从42元变动到38元,他们的博弈组合如下图所示:

如上图所示,每个单元格中,右上角是BB公司的利润,左下角是RE公司的利润。

其中填充蓝色的单元格就是纳什均衡点,在这里,两家公司的利润都是40000元,对两家公司而言都是一个稳定的结果,从这个点向四周改变,或者对两家公司或者都不利,或者对其中一家不利,只要有一方感觉不划算,就会调整价格,那个点就不会稳定,而只有这个点是很稳定的。

寻找的方法:

这里对纳什均衡点说不出更高深的解释,只是根据对纳什均衡点的理解,说说寻找它的方法吧,至少我试过几个例子,都没有发现错误。步骤如下:

  • 1.从BB的定价开始,在其定价确定的前提下,分别从每一列中寻找对RE公司而言,利润最高的单元格,然后将这些单元格连接起来,就是图中的紫色曲线;
  • 2.从RE的定价开始,在其定价确定的前提下,分别从每一行中寻找对BB公司而言,利润最高的单元格,然后将这些单元格连接起来,就是图中的黄色曲线;
  • 3.两条曲线的交点就是纳什均衡点。

最后,两条曲线的交点有多少个,该博弈就有多少个纳什均衡点,本章所介绍的石器时代猎人狩猎会合的博弈被称为“确信博弈”,按照书中的介绍,这不同于前章的“囚徒困境”博弈:因为“囚徒困境”对一方而言,无论对方的选择如何,自己始终存在“优势策略”;而“确定博弈”只有双方选择相同才是“优势策略”。

看上去,“囚徒困境”好像是“确信博弈”的特例,但是将博弈表列举出来才会发现,仅仅因为某些数字的变化,两者还是有着很大的区别。例如:对比58页“囚徒困境”案例中,同样是上述两家公司的处境,由于在对手公司不降价的前提下作出降价选择,会让降价公司获取巨大的利益,所以,追求利益的公司几乎不可能会对手保持不降价的一致选择。

结果,在“囚徒困境”中,按照上述寻找纳什均衡点的方法操作,同样会发现这样一个点(按照我的理解,这个点应该也是纳什均衡点!),一个双方都选择背叛后沦落的全部失利的下场,对于“确信博弈”而言,只有双方选择一直,哪怕是所谓的“背叛”,大家仍然可以获得最好的结果,唯一的区别恐怕只是,当存在多个纳什均衡点时,哪个才是“聚焦点”的问题。

————————

继续阅读本书发现,回味纳什均衡,其中“同时行动”的意味深长,倘若换成“序贯行动”,即后者可以根据前者的选择再决定行动,而前者无法针对后者的选择重新调整,这种情况下去找出的纳什均衡点,可并不是个好的选择(参见原书第6章策略行动中,晚上的自己设定闹钟叫醒清晨的自己,本应该用博弈树分析的例子换成博弈表之后,作者分析的过程和结果。)~甚至,我怀疑这种博弈是否存在纳什均衡点……继续读下去吧~

“同样的商品,倘若发现比本店售价更低的,本店补偿差价,并XX倍赔付!”——虽然这可能是个拙劣的表述,但是生活中此类的低价承诺丝毫不稀奇。为了制造低价、超低价的消费者印象,商家使尽招数,媒体的曝光也大多围绕商家的文字游戏,质疑商家是否遵守这样的承诺进行。但是,来自博弈论的分析说明,“价高赔付”的意义不仅如此(也许你早就知道其中的猫腻,但是博弈论提又提供了一种策略视角)。——推荐《妙趣横生博弈论》!

说来惭愧,看了一个多小时,这本《妙趣横生博弈论》第三章最后几页才勉强翻过,也许是思想不集中,也许是思考太多。模型就是那个著名的“囚徒困境”:合作可以带来集体利益的最大化,背叛的人虽然伤害了集体利益,却可以获得更大的个人利益,然而,如果大家都背叛,所有人都要承担最坏的后果。京都议定书(全球温室气体排放控制)、卡特尔形式的欧佩克、集体经济、核威慑、民主议会……这些都有囚徒困境的影子。

回到商家的“价高赔付”,这是商界囚徒困境中最后介绍的例子。按照我的理解,依据“是否存在隐性协议”将其如下分析。这里所谓的隐性协议,就是提供商品的若干商家,通过不为外人所知的方式对某种商品售价作出约定。本书的背景为美国经济,由于反托拉斯法案的存在,显性协议很容易被发现,所以隐性协议的甄别很重要。

情况1:存在隐性协议

诚如书中所言:如果两个A和B商家通过隐性协议对衬衫的售价约定为80元,然后,每个商家都宣称自己是最低价,并且提出发现更低价即可获得高额赔偿的口号,这种口号让消费者感觉到自己所购物品有价格最低的保障,并且鼓励其中一部分人去侦察更低价。

于是,一旦A为了赚取更多利润,从而通过降价增加销售量,既争取边际消费者,又拉拢B的用户。在B那里购买衬衫的消费者必然会要求B赔付,受到损失的B也就会降价,从而价格站开始,AB两败俱伤;同样,对B而言,有着与A相同的处境。由此,A或者B在两者构成的衬衫价格联盟(卡特尔)就会很稳定,甚至,AB在结盟之前对背叛行为(私自降价)有惩罚性的约定,当A背叛后,B虽然赔付了消费者,却通过对A的惩罚性约定会获得大于等于那份赔付的收益。

现在看来,AB的卡特尔稳定了,消费者却遭殃了,因为他们都不会降价,也就都可以获得远超衬衫成本的垄断高额利润。更可悲的是,消费者还自以为自己获得了“最低价”!

情况2:不存在隐性协议

如果真的不存在隐性协议,商家冒那么大风险、自寻麻烦去做——“如果不是最低价就向消费者高额赔付”的承诺,真的是为消费者好吗?价格越低,利润就越少,如果不能通过足够的销售量来拉动,神仙经商也必亏无疑。正常的商家肯定都是先考虑到自己的利润,在价格和销售量中间取得平衡,然后才是各种营销口水、企业责任的承诺。

所以,彼此不存在隐性协议的商家们,通常都不会去做这种“价高赔付”的亏本承诺。当然,我相信也有例外:如果AB分别是家乐福和沃尔玛这样的零售巨头,提出这样的承诺口号一点也不稀奇,即使他们之间不存在隐性协议,因为他们通过这种口号是在给自己的供应商施压:“如果你提供给我们的价格比家乐福高,我们很快就会知道的!到时候你就等着按照供货协议接受惩罚吧!”沃尔玛可能会这样说。而在同样供货价格的基础上,就算不做售价约定,捆绑、引诱、折返……零售巨头们的赚钱手段也是很多的。更何况,供应商还可以设定“建议零售价”,当两个零售商都采用这个价格时,连隐性协议都不需要了。

这种情况下,对于消费者,“最低价”也只是零售巨头们的伎俩,没有收益的事情他们更不会做。相对于最终售价,进货价格中的利润也许又是由有着隐性协议的生产商们早已经攫取了的。看来,消费者又是获得了自以为的“最低价”+零售商的促销价。

最后,感慨一番博弈论中,对于站在对方的立场上思考问题和作出决定的策略。嗯,我们是应该站在商家的立场上看看他们收益了什么,即使被骗,也知道在哪里上当了;但是在生活中,也别忘记首先看看自己盘子中有什么,别老盯着人家盘子里的。

·······························

附:博弈论中破解“囚徒困境”的几条策略:

  • 1. 清晰界定参与者;
  • 2. 清晰界定允许和禁止行为;
  • 3. 清晰界定惩罚OR奖励机制;
  • 4. 建立快速有效的欺骗识别机制。

最近对经济学类的图书比价感兴趣,正在读那本《写给中国人的经济学》,而其中又牵涉到博弈论,两个案例令人印象很深。

1.“囚徒困境”:

两个囚犯被分别关押,彼此不能沟通,每个人都有抵赖和坦白两种选择。事实上,由于证据不足,两人都抵赖的话,只好把他们全放了;但是如果一个人坦白,而另外一个人抵赖,则抵赖的人要承担最重的刑罚,坦白的人相对受罚较轻;当然,如果两个人都坦白,都会承担比较重的刑罚。

显然,通过列出一个条件矩阵就可以分析对囚徒来说最有利的选择,但是两个囚徒彼此的信任程度和谋求自身最大利益的本能,都会让事件趋于两个人都坦白的情况。一时感慨,难怪叫“囚徒困境”!警察审讯犯罪嫌疑人莫不就是利用这个道理!而且,抓获的犯罪团伙成员越多,就越容易得到坦白的结果;同样,如果犯罪嫌疑人只有一个,那这个方法就不见效了。

2.“海盗分金”:

说5个海盗抢了100枚金币,准备分赃的规则如下——通过抓阄的方式确认5个人的次序,然后由第1个人提出分赃方案,如果不能获得超过半数的人员支持,他就会被杀掉,由第2个人提方案,如果还是不能获得剩余人员超过半数的支持,他也被杀掉,以此类推。

稍加思考就知道要从最后一个人向前分析:

  • A. 从最后一个人E开始分析,他肯定对前面所有人的方案都投反对票,因为前面的人都死了,金币自然全部是他的了;
  • B. 接着是倒数第二个人D,如果由他提方案,届时一共只有两人投票,最后那个人又必然投反对票,他的方案无法超过半数同意,那他只能死了,命比钱贵,他哪怕不要钱也不能让前面那个人死,所以他对于倒数第三个人的方案必然投支持票。
  • C. 对于倒数第三个人C而言,肯定对前面两个人的方案投反对票,因为只有他们死了,自己才能提方案,而且他提的方案即使把100个金币全部据为己有,倒数第二个人也是没有意见的,而这样他的方案就可以获得通过。
  • D. 现在对于倒数第四个人B而言,如果轮到他提方案,说明第一个人已经死了,剩下的四个人里,两个人都会投反对票,他无论如何也不可能让自己的方案超过半数,所以仍然会死,为了避免这样的结果,他必须给第一个人的方案始终投赞成票。
  • E. 最后,就是倒数第五个,也就是第一个人A的处境了,C和E肯定要投反对票,而自己和B会投赞成票,那么剩下的关键一票就是D了!原书中认定D投赞成票,但是我觉得不会,因为对于D而言,如果A的条件不好,他完全可以让A先死,接着B必然也死,轮到C的时候,D才没有选择,哪怕没有任何收益也要支持C的方案。所以,为了争取到D这一票,A的方案就绝不能是自己占有100枚金币,而应该是:自己占有99枚金币,给D分1枚金币,其他人不分金币,这样,D在无法预知C给自己分多少金币的情况下,肯定不会做放弃现有哪怕是1枚金币的利益,所以,他必然会支持A的方案。

于是,为了自己的利益最大化,第一个人的方案就是:给自己留99枚金币,给倒数第二个人分1枚金币。

从其中可以看到,抽中偶数号的同志们基本是没有分配权的,这就是个杯具啊!