《博弈生存》

下载本书

添加书签

博弈生存- 第10部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!

发菜是宁夏“四宝”之一的“黑”宝,宁夏的农民为了多赚钱,大规模地采集发菜,以销往南方,以至于当地政府不得不明令禁止这种行为,并将发菜从宁夏“四宝”中去除。而在甘肃挖甘草已成致富之路,据估计每挖10公斤甘草要破坏5。3公顷~7。3公顷的草地。

这与哈定的公共资源悲剧何其相同,其原因就在于环境资源是大家的。

发展经济与对自然的破坏
现在各国都在发展经济,GNP(国民生产总值)或人均GNP是一国富裕程度的指标,或者说是国力强弱的指标,各个国家都在制订促使GNP增长的政策。然而,GNP的增长完全建立在对自然的破坏之上,可以这么说,GNP是对自然破坏的指标。

当然,有很多人不同意我这里的观点。为什么美国那么富裕,而对自然破坏得较少?美国的环境是保护得最好的。其实,这有三个原因:第一,美国的生产或消耗的原料有很大一  
部分来自于别国,如石油来自中东,美国GNP的增长建立在他国对自然的破坏之上;第二,美国的产品许多是高科技产品,高科技产品对自然的破坏较轻,但它会加大人类的破坏力量;第三,像美国生产的高科技产品往往难以被自然消解,自然对加工粗糙的产品的消解是容易的,而对用高科技制造出来的精巧的物品消解起来是缓慢的,但这种对自然的破坏不是那样直观,因此常被我们忽略。

可以这么认为,人类社会的发展对个人来说是没有选择的自由的。当周边国家进入工业社会,发展机器工业,可以在较短的时间生产出比农业社会更多的物资,并且可以生产出以前没有的东西,试想一想,有哪个国家看到这种情形还会无动于衷?并且重要的是,没有选择发展工业的国家面对周边国家的强盛,它的安全受到威胁,它除了被动地选择进入工业社会,别无其他选择。18世纪工业革命首先发生在英国,西方国家相继进入工业社会。而远东的中国,在距离上离发生工业革命的西欧较远,直到19世纪中叶才感受到工业革命的冲击——在列强枪炮的攻击下被动地接受工业化。20世纪的中国其实是被动地接受现代化的。在社会发展史上人们在很大程度上是没有多少选择余地的,这一点正如马克思所认为的,生产力是最具革命性的力量,它促进生产关系的发展。

我们这里要说的不是历史的发展规律问题,而是要表明:当前世界各国竞相发展经济、对自然进行破坏,是一个集体行动的悲剧。有读者可能无法理解:发展经济是好事,为什么能和哈定悲剧联系在一起?

发展经济对人类确实是好事,人类总不能生活得与动物世界一样。但问题是,当今经济的发展已经进入过渡时期,经济的发展造成了环境的破坏。

市场经济是竞争经济,在这样一个优胜劣汰的格局下,拼命地向自然索取或者说掠夺是现时代的特征。每个竞争者——可以小到个人,大到国家——都这样想:我不发展就有可能被淘汰出局。而经济的发展就是对自然的利用——无论这种利用是对自然中原始物的加工还是对中间产品的再加工,其结果都是自然被加速地破坏。这就是自然的生态状况愈来愈恶化的原因,其结果是人类的生存环境越来越恶劣。这也是囚徒困境。

许多人清楚人类目前的这种状况,但谁也没有良药,因为“破坏—发展”是占优策略,每个参与者采取“破坏—发展”成为集体行动的纳什均衡。这就是悲剧:大家都意识到问题所在,但大家都无能为力。

光天化日之下的违法
行为为什么总能成功?人类有许多关于猴子的故事,比如朝三暮四,杀鸡给猴看。其实猴子是没有思维的,它们有一定的群体意识,但没有社会意识,人们关于它们的故事其实是说人自己的。我们这里也讲一个猴子的故事。

在一个笼子里关了一群猴子,主人每过一天就打开笼子抓一只猴子去杀掉。每天主人来时,每个猴子都紧张,它们不敢有任何举动,怕引起主人的注意而被主人选中。当主人把目  
光落在其中一只猴子身上时,其余的猴子就希望主人赶快决定。当主人最终作出决定时,没有被选中的猴子非常高兴。那个被选中的猴子拼命反抗,其余猴子在一旁幸灾乐祸地观看,这只猴子被杀掉了。这样的过程日复一日地进行着,最终猴子全部被宰杀掉了。

如果这群猴子群起而攻之,有可能会逃掉。但每只猴子不知道其余的猴子是否会和它一起反抗,它怕自己的反抗会引起主人的注意而被主人选中宰杀掉。

在现实社会中,窃贼在公共场所比如公共汽车上偷东西时,车上的乘客看到了,但不敢吭声。没有被偷的人想,反正被偷的待宰猴群的结局人不是我,我反抗了,我得不到任何好处,反而遭到伤害;而不反抗虽不得益,但也不受损,我何必要反抗呢?这就是光天化日之下的偷窃行为为什么总能成功的原因。

窃贼在偷东西时发出这样的信号:如果谁反抗,将殴打谁。乘客想,窃贼的威胁是可信的:因为如果个别乘客反抗,而窃贼不殴打该乘客的话,就会有更多的乘客抓窃贼,窃贼将有可能被抓,因此窃贼必然欧打反抗的乘客。 乘客的策略及可能的支付为:反抗,有可能被殴打甚至受伤;不反抗,无所得也无所失。这一博弈过程为:

对于乘客来说,窃贼的威胁是可信的,因而乘客的最优策略是“不反抗”;而对于窃贼来说,乘客“不反抗”下的“不殴打”策略为最忧。

这一博弈的结果是,窃贼偷东西时“乘客不反抗,窃贼不敢打”,这是一“子精炼纳什均衡”。

这样一种群体不反抗的结果将使社会风气恶化,偷窃之风盛行。对个体来说,虽然这一次被偷的不是你,但下次你被偷的几率增加了。这使得我们都如同待宰的猴子,我们不知道什么时候轮到我们自己。这样,我们每个人的处境比以前更差。

如何从这种困境中摆脱出来?

我们看到,使乘客采取“反抗”策略,而非“不反抗”策略在于加大采取“反抗”策略的获益,而减少不反抗的获益。当“反抗”策略下的获益大于“不反抗”策略下的获益时,乘客就会采取“反抗”的策略。

加大道德宣传,培养人的道德感可以解决这个囚徒困境。增强人的道德观念就是加大“反抗”策略的获益,即:当反抗时,尽管有受伤的可能,但是道德荣誉感或道德满足感将使得乘客的心理有所补偿;而在窃贼行窃时,乘客如果不反抗,他的道德感将使得他为他的行为感到羞耻。上述博弈过程为这样,当小偷偷东西时,尽管乘客认为窃贼的威胁是可信的,但是如果乘客是道德感强的人,那么博弈结果是“乘客反抗,小偷殴打”,从而小偷有可能被抓住,这也是一“子精炼纳什均衡”。从全社会的角度来说,如果每个公民都有这样高的道德感,小偷成为过街老鼠,社会将从偷窃之风盛行的困境中解脱出来。并且小偷如果偷窃的话,他知道将会受到道德感强的公民的反抗,即支付函数成为公共知识,他偷窃的收益将很低,他很难再从事偷窃活动了。这使我们看到,此处道德是消除集体行动悲剧的一个良方。

这里,道德的人并不是不理性的,理性的人是计算的人,是对得与失作出充分计算后行动的人。这也是道德存在的科学解释,对此将在下一章作出分析。

博弈论对不合作的博弈结果的预测是令人悲哀的。但是,从这个例子我们看到,道德就是由群体实施的对所谓“非道德”的行为进行非强制性的惩罚机制,而法律及实施法律的国家的形成与改进就是建立一个对所谓“违法行为”实施的中心惩罚机制。这正是下一章要讨论的内容。

囚徒困境的消解与文明
文明和文化是什么,一直是思想家思考的问题。我们无法给文明和文化下一个明确的定义,但我们可以认为,文明及文化均是人类独有的现象。当然我们也在寻找地球外的文明,但是否有天外文明仍然是个谜。

20世纪80年代弗洛伊德的精神分析理论开始在中国流行,他对人类文明的独特见解曾迷倒许多莘莘学子。

 
他认为,文明是对人的本能的压抑,人的历史就是人的本能被压抑的历史。在他看来,人有“生的本能”和“死的本能”,前者称“性本能”或“爱的本能”,后者称“死亡本能”或“破坏本能”。本能的目的是满足,但是如果本能得到完全的满足,则没有了文明。人所追求的目标是各种需要的满足,而文明则是要人彻底抛弃这个目标的。因此在他看来,文明就是对本能的压抑与利用。

而在社会学大师韦伯看来,文明是对人的贪欲的压抑,社会的各种组织理性化就是为了压制和利用人的贪欲。

由此可见,要解释文明就是要解释利己的个体是如何得到约束的。下面将从博弈论的角度提出一个新的文明观:文明其实就是对集体行动悲剧的克服。

在囚徒困境中,每个参与者选择的占优策略是“招认”即“不合作”,如果对囚徒博弈在参与者之间进行重复博弈呢?试考虑这样一个非合作博弈:甲、乙两人博弈,两人各有两个策略。各策略下的支付矩阵为:

文明是对人的贪欲的压抑

甲乙不合作合作不合作(1,1)(5,0)合作(0,5)(4,4)

但是如果此时,两者的纳什均衡为(不合作,不合作)。

在第二阶段假设支付情况是这样的:当在第一阶段采取的是“合作”策略时,将有额外的收益3;如果采取“不合作”策略,则没有任何额外收益。即:在第二阶段额外的支付矩阵为:

甲乙不合作合作不合作(0,0)(0,3)合作(3,0)(3,3)

假设在第一阶段博弈双方知道这个两阶段博弈在各种策略下的结果,于是这个博弈可由上述两个矩阵相加得出:

甲乙不合作合作不合作(1,1)(5,3)合作(3,5)(7,7)

这两个阶段博弈其实是一阶段博弈。在这个博弈中(合作,合作)是纳什均衡,而这个结果就解开了囚徒困境。

这个例子的社会意义是什么?这里关键是对上面第二阶段的支付矩阵的解释。

一种解释是:如果第一阶段双方只要有人采取不合作的策略,那么以后双方便不能合作,以后的收益为0。这相当于在生意场上如果一方欺骗了一方,那么以后双方便不能合作。如果第一阶段采取了合作,那么双方在第二阶段没有理由不采取合作,这就等于说,第二阶段是第一阶段的自然结果。

其实,第二阶段的支付矩阵是赏罚矩阵,是对参与者第一阶段采取某种行动的“赏罚”。即:如果第一阶段双方采取了“合作”,那么将对双方奖励3;如果第一阶段有一方采取不合作,则收益变为0。

在这个例子中,奖惩矩阵是在参与者之间建立起来的。而一般来说,存在两种情况:一是参与者在博弈过程中自动建立起来的,这就是演进博弈研究的内容;第二种情况是非博弈第三方强加于参与者之上的赏罚矩阵,从而调节博弈结果。

摆脱囚徒困境的这个方法或者说模型对于社会有什么解释力呢?我们说,文明就是这个赏罚机制的建立,而道德与国家的目的就是建立这样的机制。

一个关于猴子的故事
这里再讲一个关于猴子的故事:

有一群猴子被关在笼子里,在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了,这个过程重复着,猴子们发现,尽管有猴子吃到香蕉,但吃到  
香蕉的猴子是少数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了。

在这个故事里,猴子间产生了“道德”。如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是“不道德的”,它们也会自动地惩罚“不道德的”猴子。

当然这只是一个故事,这个故事反映了人类的道德的产生过程。

人天生是自私的,他努力使自己的利益最大。当然这不是对现实的人的看法,而是一个抽象的假定。但现实中的人为什么有道德呢?从自私的假定中怎么推出道德的人?

上述猴子的“道德”产生的故事可以用来解释博弈论专家对道德的阐述。

人类原初的状态就是囚徒困境
人类的天性是驱利避害的,从动物状态走出来时人是自私的。自私的人在交往中每个人为了自己的利益而产生的结果正是一种囚徒困境。

英国哲学家霍布斯假设了人类的原初状态,用他的话说,自然状态中人与人之间像狼与狼一样,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有  
正义或不正义,只有战争。武力与欺诈是战争中的两大基本德性。

在自然状态下,霍布斯说,是没有工业、知识、艺术、社会的一点余地的。

霍布斯对自然状态的假定,目的是要引申出他的政治主张。他认为,在这种状态下人的生活是悲惨的。为了摆脱这种状态,人们便汇聚起来,建立契约,同意确立一个权力者或权力团体,这就是利维坦,这个拥有巨大权力的利维坦对人们使用权力,以结束每个人对每个人之间的混战。这就是霍布斯的社会契约论的思想。

在“霍布斯模型”中,国家以法律条文规定对某种行为如“战争”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“战争”行动中获取的好处大于他采取“和平”

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架