所了解——也许他们都是优秀学生,每次考试成绩都在B以上——这样你就能通过将这个信息加入方程来调整最终的概率分布。如果你了解一些参与者的热度状况——如习惯于探索不同的可能策略——你就能够将此信息也考虑到算法中,来改善你的概率分布。在伯克利大学和普度大学同行的共同努力下,沃尔波特正开始在真实人群中检验这个观点——或者至少是在大学生中进行。
“我们已经在本科生身上进行了一些实验,实验中我们实际上关注了他们的热度状况,在一组重复的游戏中——此案例中为投票游戏——然后观察他们的热度状况随时间推移是如何变化的。他们实际上是变得更理性了还是没那么理性了?不同个体的热度状况之间又有什么联系?当你变得不那么理性的时候我是不是变得更理性了?”
举个例子,如果一个参与者总是做出一样的选择,这个行为使得其对手更容易判断他/她的举动。“这就很直观地表明如果你的热度状况下降,我的就会上升,”沃尔波特说,“所以我们进行这些实验的意图实际上是想找出那些影响。”
第五节 心理史学的视角
这些实验,在我看来,应加入那些行为博弈论者和实验经济学者们已经积累的(包括)关于人类行为方面的知识。这听起来就像是沃尔波特在说,为了改进博弈论的预测能力,所有这种知识都该加入到概率分布公式中。但是在我能问我脑中究竟想到什么解决办法之前,他就推出这精密的理论准确地将我带到了我想去的地方。
“让我们这么说,你对心理学有所了解,并且你已经从实验得到一些结果,”他说,“而且在这里面(概率分布公式中)你实际上还有其他一些东西,除了知道人们都有热度这个属性之外。你也了解一些他们风险规避的程度,以及这个、那个,等等。你不是只有热度这一个特征;你还有很多其他方面的特征。”
加入这些有关真实人的知识到公式中后就降低了无知度,而正是依靠无知度我们才能得到原始概率分布。所以,除了基于所有可能混合策略的预测,你还将得到更能反映真人参与情况下的预测结果。“正式地说,这实际上是将博弈论和心理学结合起来了,”沃尔波特说,“结合用来处理激励和效益函数及回报的数学模型来定量单个个人的行为。”
沃尔波特开始谈论股票市场预期走势中的概率分布问题,然后几乎是旁白一样,揭示出其更广阔的用途。“从艾萨克·阿西莫夫的观点说,就是一种试图得到研究心理史学的数学能力的一种途径,”沃尔伯特说,“换言之,它有潜力——也就是还没实现——有潜力成为研究人类行为的物理学。”
就像我先前怀疑的,阿西莫夫的心理史学和博弈论中的行为学间存在着隐含的相似性,而事实上这相似性反映出一些普遍的、根本性的数学原理。是数学融合了博弈论和统计物理学。所以,沉浸在沃尔波特所说的话中,我意识到,除了心理史学或社会物理学或自然法则,有一个更好的方法适用于人类行为的科学研究。那应该是博弈物理学(游戏开发物理学)。
唉,“博弈物理学(游戏开发物理学)”已经被使用了——它已经是一个专业术语,被计算机程序员们用来描述模拟电视游戏中物体如何移动,以及如何蹦来蹦去的动作。但是它也很好地抓住了心理史学或社会物理学的真谛。结合了统计物理学的博弈论,博弈的物理学,是社会的科学。
后 序
让我们来考虑社会经济的物质基础——或者从更广泛的角度来说,整个社会的物质基础。根据所有的传统和经验,人类用一种特有的方式来调整自己以适应这样的背景。这并不包括建立一个严格的分配系统,而是提供很多选择,这些选择可能都代表了一些基本原则,但在特定方面有所不同。这个系统描述了“建立了的社会秩序”或者“被接受的行为准则”
——冯·诺依曼和摩根斯特恩,《博弈论与经济行为》
尽管题目中出现了游戏,经典的科幻小说《安德的游戏》并不是关于博弈论的,至少表面上看不是。但实际上它却是。整本书都是关于选择策略达到目的——关于成人们设法操纵年轻的安德·维京。安德·维京选择战略来赢得一场模拟的战斗,安德的兄弟姐妹们运用策略影响公众态度。奥森·斯科特·卡德的小说里有两段话看起来像是来自博弈论教科书,他们展示的人类本性是博弈论试图去解释的。比如说,安德的哥哥彼得正是原始的博弈论所描述的自私理性人的缩影。
只要他需要,彼得可以将任何的欲望置之脑后;他可以隐藏任何情感。因此瓦伦丁知道他绝不会因为一时恼怒伤害到她。他只会在利大于弊的时候那么做……他总是表现出聪明的自私自利。
安德自己代表了同时依靠计算和直觉来处事的社会角色,与今天的行为博弈论学家所信奉的观点更为一致。
“每一次,我能取胜因为我知道敌人的想法。从他们所做的,我可以推断出他们认为我在做什么,他们想要战斗往哪个方向发展。于是我将计就计使他们的弱点暴露出来。我很擅长这点。知道其他人在想什么。”
毕竟这是现代博弈论的全部内容——明白他人所想。然后推断他们会怎样做。这也是艾萨克·阿西莫夫虚构的心理史学的全部,几个世纪以来的社会科学家所要找寻的全部——找出社会运动的节拍,发现“自然法典”。
现代对“自然法典”的追求始于牛顿原理出现之后的世纪,那本书将运动和重力的法则作为物理世界的理性基础。哲学家和政治经济学家比如大卫·休谟和亚当·斯密从牛顿式物理中寻找一门人类行为的科学,梦想能像描述星球一样准确地描述人类行为。这个梦想穿越了19世纪来到20世纪,从阿道夫·凯特勒(Adolphe Quetelet)用数字描述社会的心愿到西格蒙特·弗洛伊德对大脑特定物质基础的探索。然而,在这个过程中,作为这个梦想的基石的物理模型自己发生了变革,从牛顿的严格决定论转变到麦克斯韦的统计描述——和凯特勒及其同事所用来量化社会的统计相同。到了20世纪末,寻找“自然法典”的物理学家们想要用统计将社会科学和自然世界统一起来。因为毕竟物理——你可以去问任何一个物理学家——是万物的科学。
第一节 物理学和万物
然而,历史上物理学家关于万物的观点却有点狭隘。在过去的3个世纪中,大部分时候物理学将自己定位于主要和物质以及引导它运动的力有关;最终,对于运动中的物质的研究混合了能量和它的转换。在刚刚过去的世纪中,爱因斯坦将宇宙时间和空间加入到这个混合中。他甚至通过合并物质和能量以及空间和时间来简化现实世界的成分。于是在20世纪的物理学家眼中,“万物”包含了物质、能量和时空。
到20世纪末,很多物理学家开始意识到有一个成分被遗失了。数字计算机隐喻性的力量让聪明的观察者认识到,信息是连接外部世界和它的科学描述的纽带。从热力学第二定律到古怪的量子力学到黑洞内部的黑暗环境,物理学家发现在编码和量化对自然的认识时,信息是一个必不可少的成分。
信息打开了物理学家通往其他存在的眼睛。信息包围了生物。生物包括人。人创造了一个新的现实世界需要物理学来思考——巨大的由经济、社会和文化系统以及制度组成的网络。因此物理学家开始将他们最喜欢的通用工具——统计物理学——应用到从股票市场到流感疫情的各种事物上。这些都在艾萨克·阿西莫夫虚拟的数学家哈里·谢顿(Hari Seldon)身上体现出来,他将统计物理学原理用于预测将来。在 21世纪的黎明到来之际,现实世界中的物理学家试着去做几乎和谢顿做过的一模一样的事情,使用统计物理学来建立社会的数学模型,以对将来做出预测。
从最初开始,博弈论就表达了相似的雄心。冯·诺依曼和摩根斯特恩关注经济,但很明显将经济视作一般社会科学的一个(虽然是主要的一个)范例。他们相信他们的博弈论是用数学方法表述集体行为的第一步,实际上是一部“自然法典”(他们用的词是“行为准则”或“社会秩序”)。
很多年以后,约翰·纳什迈出了走向社会数学的第二步,他将纳什均衡引入到博弈论的观点中。如果在一场博弈中所有竞争者都追逐个人利益——试图最大化他们的期待收益——那样将总是存在一些策略组合使每个人都能得到最好的收益(假设每个人都尽力)。在任何博弈中都存在的纳什均衡提示人们社会是稳定的——人们没有动机去改变,因为如果其他人都保持不变的策略,改变只会降低自己的收益。
在冯·诺依曼和纳什的数学中,最本质的特征是需要“混合策略”来获取最大收益。很少情况下单个“纯粹的”策略会一直是你最好的选择。你的最好策略通常是来自很多可能的选择,其中每个选择有特定的概率。
在博弈论以及它在现实生活和社会的应用中,这种混合策略是个不断重复的主题。进化的过程中,自然使用了混合策略,产生了包含很多物种的复杂生态系统。人类使用混合策略,包括合作者、竞争者和惩罚者。地球的居民代表了文化的混合策略,从小气独居的秘鲁马奇根加人(Machiguenga)到慷慨群居的肯尼亚奥玛人(Orma)。甚至在物理学领域内,量子力学展示了世界本身是一个亚原子水平的混合策略,博弈论学家也许可以利用这种特点来解决令人困扰的两难问题。
这样一种有着特定概率的选择的混合,在数学上被称为概率分布。而概率分布,碰巧也正是统计物理学所涉及的。阿西莫夫心理学史的基础是将概率法则应用于大样本人类个体来预测集体行为,正如统计物理学家计算大量分子的概率分布来预测一种气体的性质或者化学反应的过程。正如物质和能量,或者时空。博弈论和物理学是一枚硬币的两面。如佩·班娜塔(Pat Benatar)会说的,它们同归同属。这是一个简洁、紧密的配合,很奇怪为什么博弈论学家和物理学家们在这么长时间之后才认识到这种潜在的关系。
第二节 天生的分离
当然,博弈论是在物理学的土壤中孕育出来的,因为冯·诺依曼和摩根斯特恩使用的推理都基于统计物理学。冯·诺依曼提到当描述经济系统中大量群体交互时统计是有用的。纳什推导纳什均衡时提到了反应分子的统计交互。毕竟,纳什在转攻数学专业之前在卡耐基工学院学习化学工程和化学,而他在普林斯顿的博士论文使用了“质量作用”的化学概念来解释纳什均衡。质量作用指的是反应中的所有化学物质决定了反应的平衡条件,一种分子能量统计物理学所描述的过程。将物理学中的平衡概念借用到化学中的分子系统,纳什衍生出一个类比的概念,即由人组成的社会系统的均衡。纳什的数学是关于人的,但它基于分子,而且这种数学将博弈论和社会科学与物理学统一了起来。物理…社会相联系的种子在纳什的美好心灵中播种开来。
这颗种子以不可思议的方式萌芽并成长,结出了成倍的果实,促进了很多科学领域的进步,从经济学、心理学和社会学到进化生物学、人类学和神经科学。博弈论提供了一种通用的数学语言来联合这些科学,它们代表了拼图的各个块,拼在一起得到了生命、思维和文化——人类集体行为的总和。博弈论的数学也可以被转换成物理学的数学的事实表明了它是揭开万物真正原理的密钥,统一物理学和生活的科学。
毕竟物理和生命的系统都寻求稳态,或者说均衡。如果你想要预测一种化学反应的进程或人类的行为,未来会如何演化,你必须知道如何计算均衡。博弈论展示了为什么达到一个均衡点需要混合策略——以及对混合策略的需要如何驱动复杂性的创造。换言之,进化。博弈论描述了进化的过程,这种过程产生出不同物种的组合、不同类型的人的组合、不同策略的混合、不同环境下出现的不同文化的组合。
博弈论描述了产生复杂网络的进化过程。选择混合策略的大脑是神经细胞的网络;展示出多元文化的社会是大脑的网络。把它们放在一起,你得到一个用来量化自然(真正包含了万物)的框架,一个将生活和社会科学的博弈论和描述物质世界的物理学融于一体的框架。
不论如何,博弈论并不像理论物理学家长时间孜孜以寻的“万能理论”那样流行。对“万能理论”的追求只是在寻求描述所有自然界基本粒子和力的平衡,描述建造大楼的砖瓦的数学。一旦你知道了原子如何组合在一起,这个观点成立了,你就不需要去考虑其他事物。然而博弈论正好是关于其他事物的。它是关于将自己建立在宇宙的物理基础上的生命的领域。它是关于人们如何从丛林中孕育出文明,关于行为的准则、社会秩序的建立和由此产生的“自然法典”的。
第三节 危险
寻找“自然法典”总是要冒一种危险——那就是它会被当作一种教条式的决定论来看待人类行为,否定了人类精神的自由。一些人非常反对这种教条式的东西。二十世纪七十年代,在社会生物学的名义下,“自然法典”存在于人类基因中的观点得到了发展,反响有些讽刺,让人们看到智慧如何常常被谩骂打败。社会生物学的聪慧的后代,进化心理学,提出了一个更精密的用进化来解释人类行为的网络,但是它内在的假设认为大脑网络会使用纯粹的策略,这和现代神经生物学和行为人类学的研究发现并不一致。
另一方面,博弈论在遗传力量的倡导者和人类自由的捍卫者之间提供了一种可能的和解。博弈论追求另一种不同的通往“自然法