如美国声称,如果中国武力攻打台湾的话,美国将介入。这是美国声称的策略。美国通过这言语上的声明,目的是为了恐吓中国政府。而中国政府同样以言语回击:是否以武力收复台湾是中国的内政,美国无权干预。言下之意,如果美国干预的话,美国和中国将发生战争。如果中国政府真的武力攻打台湾以实现国土统一,美国真的会介入吗?这是中国政府所要考虑的问题,即要弄清美国届时实际的策略是什么。而美国也要考虑,一旦战争打起来,美国如果干预的话,中国会向美国开战吗?
因此要分清行动者真正的策略决定与声称的策略决定。真正的策略决定,我们说是规定真的,因为它是行动者从利己的角度确定的,行动者没有理由确定对自己不利的策略决定。而声称的策略决定本身也是一种策略,或者说本身是一种决定了的行动。行动者通过这个行动来达到某种目的。
可以这么认为:“人不犯我,我不犯人;人若犯我,我必犯人”是一种声称的策略决定。而“如果天下雨,我将带伞”则是真正的策略决定。
怎么区分这两种决定呢?
声称的策略决定首先是一种语言行动,而真正的策略决定不是一种语言行动。声称的策略决定是行动者向其他行动者说出去的一种行为,它是行动者的一种行动。而真正的策略决定是不是需表达出来的,其他行动者有可能知道也有可能不知道,并且有时这种真正的策略决定是保密的。
其次,声称的策略决定与真正的策略决定可以相同也可以不同。行动者的真正的策略决定是利益最大化得来的,只要社会的逻辑结构或博弈结构给定,行动者就会有自己的策略决定。囚徒困境中,被警察抓到的囚徒——行动者或博弈方,在警察给了他们的支付矩阵后,他们就会分析出自己的策略决定,即:无论对方招认还是不招认,他的最优策略是招认。
言语博弈中的“威胁”与“承诺”
在现实中,我们经常看到声称的策略决定,但是这些声称的策略可信吗?
声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题上的言语博弈就是威胁的。而在国际核武器问题上,我国及其他一些国家承诺“不首先使用核武器”就是一种言语承诺。
博弈论中,经常用“可置信”和“不可置信”的“威胁”或“承诺”来区分行动者说出来的策略,我们在对动态博弈的分析中会分析什么样的策略是可置信的,什么样的策略是不可置信的。而分析“威胁”或“承诺”是可置信的还是不可置信的方法是倒推法。
倒推法(backward induction)也叫逆向归纳法。那么什么是倒推法?
要理解什么是倒推法,先来看一下商界里经常见到的博弈。
在某个城市假定只有一家房地产开发商A,我们知道任何没有竞争下的垄断利润是很高的,假定A此时每年的垄断利润是10亿元。
现在假定有另外一个企业B,准备从事房地产开发。面对着B要进入其垄断的行业,A想:一旦B进入,A的利润将受损很多,B最好不要进入。所以A向B表示,你进入的话,我将阻挠你进入。假定当B进入时A阻挠的话,A的利润降低到2,B的利润是1。而如果A不阻挠的话,A的利润是4,B的利润也是4。
现在让我们回到房地产开发商之间的博弈问题。A的最好结局是“B不进入”,而B的最好结局是“进入”而A“不阻挠”。这两个最好的结局不能构成均衡。那么结果是什么呢?
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如果进入,A真的阻挠的话,它将受损失1(假定1是它的机会成本),当然此时A也有损失。对于B来说,问题是:A的威胁可置信吗?
B通过分析得出:A的威胁是不可置信的。原因是:当B进入的时候,A阻挠的收益是2,而不阻挠的收益是4。4》2,理性人是不会选择做非理性的事情的。也就是说,一旦B进入,A的最好策略是合作,而不是阻挠。因此,通过分析,B选择了进入,而A选择了合作。双方的收益各为4。
在这个博弈中,B采用的方法为倒推法,或者说逆向归纳法,即:当参与者作出决策时,他要通过对最后阶段的分析,准确预测对方的行为,从而确定自己的行为。
在这里,双方必须都是理性的。如果不满足这个条件,就无法进行分析了。
这个例子只是简单的两阶段博弈,而三阶段或更多阶段的博弈,可用同样方法加以分析。
在动态博弈中,涉及“威胁”与“承诺”是不是可信的问题。静态地看,一博弈存在许多均衡。
因此,阻挠,不进入的纳什均衡点得以淘汰,在动态博弈中一个新的均衡——子博弈精练纳什均衡——得以实现。子博弈精练纳什均衡的定义及分析,归功于另一位诺贝尔经济学奖获得者塞尔屯(Selton)。
这里分析的是完全且完美信息下的动态博弈。所谓完全信息是指:博弈的支付函数是“公共知识”(我们在第一部分叙述了公共知识的含义)。本书中未涉及不完全信息的博弈问题,如囚徒困境这样的静态博弈也是完全信息博弈。完美信息是针对动态博弈而言的,指参与者知道博弈的所有历史。
倒推法是动态博弈中有用的工具,它可以说是理性的人自然的推理方式。然而倒推法面临着一个困难,这就是蜈蚣博弈的悖论。(参见第六章)
上面我们分析了“威胁”是否可信,下面我们可分析“承诺”是否可信。“不首先使用核武器”的承诺可信吗?这个承诺是针对常规战争而言的,即:只要大家都运用常规武器进行战争,那么承诺者将不首先使用核武器。在常规战争下不涉及国家生死存亡的时候,这个承诺是可信的。因为如果承诺者首先使用核武器,将使他国也对它使用核武器,这样一来,它会因首先使用核武器而带来更大的灾祸。但是,如果在常规战争中某国面临着被消灭的危险时,它还不首先使用核武器吗?在这种情况下,使用核武器有可能挽救这个国家,而不使用,则该国肯定灭亡,即使用的好处大于不使用的好处。因此,这个承诺在一个国家面临灭亡的时候将是不可信的。
空口声明博弈
在博弈论中存在另外一种言语博弈,英文叫cheep talk。cheep talk 可翻译成“空口声明”,它是一口头表态,发话者说出某些话语无需某些成本,也无须承担某些责任,它不是“威胁”也不是“承诺”,但发话者说出它是有目的的。听者要分析他话中的含义,即要分析cheep talk是真还是假。
如:某人应聘某职位时,他会说“我的能力很高”,这就是cheep talk。他的目的是为
了能应聘得上或者说是为了获取高工资,他说出这样的话是无需成本的,每个应聘者都可以这么说。而雇主则要弄清这些应聘者的cheep talk中哪个是真的哪个是假。
明天太阳必然能升起吗?
——归纳推理的合理性问题人有两种推理方式:一是演绎的,二是归纳的。
由前提真必然地推出结论真就是演绎推理。这是逻辑或传统逻辑研究的对象。古希腊哲学家亚里士多德确定了三段论推理形式如:
大前提:所有人皆要死;
小前提:张三是人;
结论:张三要死。
再比如:
大前提:所有的爬行动物是用肺呼吸的。
小前提:蛇是爬行动物。
结论:所以蛇是用肺呼吸的。
只要前提真,推理过程无误,演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴含的内容。数学就是演绎性的。
不仅有演绎推理,同时还有归纳推理。如:
前提1:张三要死;
前提2:李四要死;
结论:所有人都要死。
又如:
前提1:蛇是用肺呼吸的;博弈生存博弈生存博弈生存博弈生存归纳推理的合理性问题前提2:鳄鱼是用肺呼吸的;
结论:所有的爬行动物都是用肺呼吸的。
这种由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。
归纳出来的普遍性的结论不是必然真的,而是归纳真的,或者说是“或然真的”,即:结论可能是真的,也可能是假的。
归纳推理是跳跃的,结论的内容超出前提的内容。当然,这种跳跃性的过程是可质疑的。大哲学家休谟批判人们的归纳没有合理性,只是人的习惯联想而已。因为没有逻辑的理由来证明归纳法。
演绎与归纳在人的认识与行动中起着重要作用,哲学家在研究它们的作用。
人的行动很大一部分建立在归纳推理之上。那么什么是归纳推理呢?
我们每天看到太阳从东方升起而得出结论说“太阳每天从东方升起”,我们看到了几只天鹅是白色的,我们说“所有的天鹅是白色的”。
归纳推理就是从少数的观测的事例中概括出普遍性的命题。如果用逻辑学的话语说,就是从特称命题得出全称命题。所谓全称命题是指这样的命题形式:“所有的……具有某种性质”,而特称命题是指“某某具有什么性质”。当然这是一种不严格的说法。今天非经典逻辑的归纳逻辑就是研究证据与全称命题之间的支撑关系的。
从特称命题到全称命题的过程是归纳过程,这个过程中存在着跳跃。这样的跳跃合理吗?
归纳法是科学家的常用工具,而对归纳法的合理性哲学家一直在探讨。培根说过“知识就是力量”,他竭力倡导归纳法,认为知识的来源是经验。
知识来源于经验,这不容怀疑。然而人们通过经验得出知识的方法令人怀疑。18世纪英国哲学家休谟认为,归纳法其实是人的习惯联想。
我们怎么从过去每天观测的太阳从东方升起得出“太阳将每天从东方升起”的结论?根据休谟的看法,答案只能是习惯联想。我们以前观测到甲现象出现时,乙现象也出现,当我们以后看待甲现象时,我们便期待着乙现象出现,并且我们把甲现象称之为原因,把乙现象称之为结果。然而我们的结论合理吗?甲与乙之间的所谓因果联系是必然的吗?休谟的回答是否定的。
我们可设想一下:主人每天给猪喂食,当猪看到主人来时,意味着食物送来了,然而猪不能必然性地得出,主人来必然给它喂食物。因为,很可能的是,一天主人拎着刀杀它来了。这就是归纳法的困难。
哲学家无法证明归纳法的绝对合理性,如果要证明,肯定要引入其他的假定,假定自然是有规律的,但是这样的假设是无法证明的。
虽然归纳法的合理性存在疑问,但归纳法在科学中的作用则不可低估——当然这不是我们上面所举的例子中的简单的枚举归纳法,以至于有人说,归纳法是科学家的荣耀,哲学家的耻辱。
尽管如此,人们在日常生活中也是用归纳法来生活、工作的,归纳法是很有用的工具。如当我们看到有乌云时,我们会想到要下雨了,因为以前有这样的现象,然而是否肯定下雨,则难说,但下雨的概然性大,对我们来说,这就足够了。因此,归纳法是我们思维工具箱中的一个非常有用的工具,尽管不能时时有效。
归纳法在人的互动行动中作用如何呢?这是我们下面要讨论的问题。
归纳的暴力:偷东西的人应该叫小偷吗?
对事物规则性的归纳得出的结论叫规律,规律以所谓命题的形式出现——所谓命题即是有真假的句子。命题与事实的关系是上世纪哲学研究的一个重要内容,上面对归纳法的怀疑是对得出真命题的方法的怀疑。这里我们不讨论这个问题。我们来分析人们是如何用归纳法对人的行动进行归纳从而决定自己的行动的。
在现实中人们经常用归纳法来对人下结论。如果我们看到某人几次做出同样的错事,我
们肯定会认为他的能力有问题;如果我们看到某人做出几件不好的事情,我们很容易怀疑他的道德。对他人归纳性的看法会得出对方在同样的情形下会做出同样的事情的结论,因而我们会制定出自己的策略。但是,我们这样做往往陷入误区。
不能说偷过东西的人永远会偷东西,因而叫他们是小偷或贼是不正确的,犯了错误的人不一定永远犯错误。但我们往往这么思维。我们把偷了东西的人叫小偷的话,那么这种称呼本身就将他们归类,他们成为另类,这样称呼本身就等于我们用语言在他们与我们之间划了一条横沟,因而,此时语言成了一种不道德的暴力。从这一点来讲,我们的语言是不宽容的,或者说我们的语言存在着问题。
我们这里的讨论带有思辨的特点,然而我们在社会中确实是这样使用语言和思维的。我们正是通过对认识的人的几次接触而对他们得出一个结论的,这个结论构成我们对之采取“回应行动”的基础。这个回应行动包括“友好相处”、“防范对方的侵犯”、“追求从而成为恋人”、“冷漠”,等等,并根据不同情况将周边的人分类成:可以成为朋友的、有可能成为敌人的、可以成为恋人或情人的、没有任何交往的,等等。这样的归纳会发生错误,随着交往的深入,归纳会发生改变。当然有些归纳因某种现实的或偶然的原因而永远得不到改变。
一个群体在长时间的交往接触中,分化出各种固定的关系来,有些成为固定的朋友,有些成为一般的朋友,有些成为永远的敌人,当然也会出现恋人或爱人,还有一些形同陌路。即一均衡态出现了:周边的人基本上被定了位,形成了固定的关系。而这一切从归纳开始,并且在不断的交往中对所归纳的看法给以改正。这是一个博弈,在这个博弈中存在着一个对周边的人不断认识的过程,在博弈中称之为学习过程。
行动中的两种推理:归纳与演绎
博弈论是研究人的行为的,在博弈论中参与者一方面猜测其他参与者的策略,同时计算各种策略可能性下的支付(得益)。然而在实际中,一般情况下,人们是很难计算得益的。此时人们往往准备了各种备选策略,当其他参与者采取一确定策略时,自己将决定采取某种策略。
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。
赞一下
添加书签加入书架