五、博弈方法

五、博弈方法

“心理揣摩,实现共赢”的核心是博弈。博弈思想最早产生于古代的军事活动和游戏活动中。在体育游戏中,经常会出现这种情况,甲乙双方各出三个人进行摔跤比赛。甲乙双方的领头人不是让自己的队员随意地同对方某一队员较量,而是先了解清楚对方三名成员的实力,并把对方三名成员的实力同己方成员的实力做客观对比,然后作出决定:谁打头阵,谁在中间,谁压轴,以自己的弱者去对付对方的最强者,以自己的最强者对付对方的次强者,以自己的次强者对付对方的最弱者,保证二比一稳赢对方。

目前,博弈方法广泛应用于各个领域,如海底勘探、石油开采、军事对抗、气象预测、领导决策等。

1.博弈方法的含义

博弈方法又称“决策论”,是研究策略博弈的数学理论。它以组合论、概率论和统计学等数学方法分析竞争(包括比赛、抗争),使动态系统在复杂的情况下,选择最佳行为方式。由于竞争双方都在进行策略博弈,所以这种竞争的结果不仅依赖于自己的抉择和机会,也依赖于参加竞争的所有的人的行为。合理地进行这些相互依存的战略策划,就是博弈方法的主题。科学的博弈理论是数学家冯·诺伊曼于20世纪20年代发现的。1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到N人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。

在第二次世界大战以后,博弈论更加受到重视,也更加科学化。博弈论沿着纯数学理论和实际中的研究方向迅速发展,在人类对自然和人类自身进行的对策中起着越来越重要的作用。它同控制论密切结合起来,在更广泛的意义上研究自然界和人类社会中某些动态系统之间存在的冲突情况。

博弈中,双方各自希望获胜,都在进行数学推算和心理揣摩。有时推测正确,赢得胜利;有时推测错误,就失去成功。所以,博弈不是单方面的想法和行动,而是对立双方之间的互动,是双方各自作出科学、巧妙策略或对策的数学推演。

博弈方法是思维方法中比较复杂、难以把握的方法。它具有理论中的多样性和行动上的一次性特点。在作出决策之前,思维主体要尽可能地再现事物可能出现的一切情况,把它们加以分析、对比,选择出一种最佳方案,付诸实施。一旦实施,不论对错都无法挽回。博弈方法需要借助于一定的心理分析。参加博弈的双方其观念中的多元选择绝对保密,各自最后方案的决定又要依赖于对对手的分析、估测,因此,估计对手的实力固然很重要(实际上,双方的实力是大家共知的),但根据双方以往交手的情况,揣摩对方现在的心理更为重要。这是一场心理的较量。博弈方法与其他思维方法不同之处还在于,它借助于概率论、统计学、组合论等数学理论,具有较强的自然科学性,也具有较大的难度。在很多情况下,它是一些数学公式的推演,是数学模型的应用。

智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?

答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板和食槽之间。

2.博弈方法的步骤

博弈方法是一套较为复杂的、经过多种选择后作出决定的方法。它的选择过程大致分三步进行:

(1)诊断问题所在,确定目标

诊断问题所在,这是任何科学思维方法实际操作的前提。正如一位医生给病人看病,必先诊断一番,确定病因,才能对症下药。不知问题所在,不知行动的目标为何物,一切思考和行动都将是盲目的。目标明确,行动才有成效。

(2)探索和拟定各种可能的备选方案

目标明确之后,就要围绕目标寻找各种可能的方案,因为每一种可能的方案都有可能成为最后的决策。众多的备选方案是针对实际行为中可能出现的情况而制定的,在进行对比分析、组合、概率分析以及心理分析之后,方可选中某一方案作为最后方案。

在博弈中,任何一次的成败得失都关系到参加博弈的双方,双方的任何一个小的变动都可能引起结局的变更。因而,让一方没有选择,无异于让此方去牺牲、去失败,去成全对方。

(3)从各种备选方案中选出最合适的方案

这一点与探索和拟定各种可能的备选方案相联系。拟定出尽可能周全的方案不是问题的结束,而是为了从中选出最为合适的方案。从另一个角度讲,各种备选方案并非都是可实行的方案,哪一个预选方案可以实行就依赖于对预选方案进行价值分析、效益分析、可行性分析、风险度分析等。只有通过这样的分析,方可判断出诸方案的优劣。当然,判断的标准不一样,也会得出不同的结论。

3.博弈方法的类型

博弈的分类根据不同的基准也有不同的分类。

(1)合作博弈和非合作博弈

一般认为,博弈主要可以分为合作博弈和非合作博弈。这两种博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

(2)静态博弈和动态博弈

从行为的时间序列性,博弈方法进一步分为静态博弈、动态博弈两类。

静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。

动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解是:“囚徒困境”就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。

(3)完全信息博弈和不完全信息博弈

按照参与人对其他参与人的了解程度,分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

经济学家们现在所谈的博弈方法一般是指非合作博弈,由于合作博弈比非合作博弈复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡,子博弈精炼纳什均衡,贝叶斯纳什均衡,精炼贝叶斯纳什均衡。

博弈方法还有其他很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

4.博弈方法应用举例

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。现列举出许多类似于“囚徒的两难处境”这样的例子,如价格战、军备竞赛、污染等等。一般的博弈问题由三个要素构成:局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

囚徒困境

在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoners’dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事,私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下图给出了这个博弈的支付矩阵。

A\B 坦白 抵赖

坦白 -8,-8 0,-10

抵赖 -10,0 -1,-1

我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在上图中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

价格战博弈

现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。

从这个案例中我们可以引申出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上。”事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

污染博弈

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照“看不见的手”的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。

这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。

诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:“要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。”也可以这样说,要想赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。