妙趣横生博弈论txt电子书免费阅读-第11节-五福电子书

　　内布拉斯加乡巴佬队决定要用得2分的策略取胜。但欧文·费赖尔（Irving　Fryar）接到了球，却没能得分。迈阿密旋风队与内布拉斯加乡巴佬队以同样的胜负战绩结束了全年比赛。由于迈阿密旋风队击败内布拉斯加乡巴佬队，最终获得冠军的是迈阿密旋风队。
　　假设你自己处于奥斯本教练的位置。你能不能做得比他更好？
　　案例讨论
　　星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求胜，没有稳妥求和。不过，这不是我们争论的核心问题。核心问题在于，在奥斯本甘愿冒更大风险一心求胜的前提下，他选错了策略。他本来应该先尝试得2分的策略。然后，假如成功了，再尝试得1分的策略；假如不成功，再尝试得2分的策略。
　　让我们更仔细地研究这个案例。在落后14分的时候，奥斯本知道他至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略，再尝试得2分的策略。假如两个尝试都成功了，那么使用两个策略的先后次序便无关紧要了。假如得1分的策略失败，而得2分的策略成功，那么先后次序仍无关紧要，比赛还是以平局告终，内布拉斯加乡巴佬队赢得冠军。先后次序影响战局的情况只有在内布拉斯加乡巴佬队尝试得2分的策略没有成功时才会发生。假如实施奥斯本的计划，这将导致输掉决赛以及冠军头衔。相反，假如他们先尝试得2分的策略，那么，即便尝试失败，他们也未必会输掉这场比赛。他们仍然以23∶31落后。等他们下一次触底得分，比分就会变成29∶31。这时候，只要他们尝试得2分的策略成功，比赛就能打成平局，他们就能赢得冠军头衔！
　　而且，这将是尝试取胜的努力失败之后导致的平局，因此没有人会因为奥斯本一心想打成平局而批评他。我们曾经听到有人反驳说，假如奥斯本先尝试了得2分的策略，却没有成功，那么他的球队就会只为了打平而努力。但这样做不是那么鼓舞人心，并且他们很有可能不能第二次触底得分。更重要的是，等到最后才来尝试这个已经变得生死攸关的得2分策略，他的球队就会陷入成败取决于运气的局面。这种看法是错的，有几个理由。记住，如果内布拉斯加乡巴佬队等到第二次触底得分才尝试得2分的策略，一旦失败，他们就会输掉这场比赛。假如他们第一次尝试得2分的策略失败，他们仍有机会打平。即使这个机会可能比较渺茫，但有还是比没有强。激励效应的论点也站不住脚。虽然内布拉斯加乡巴佬队的进攻可能在冠军决赛这样重大的场合突然加强，但我们也可以指望迈阿密旋风队的防守也会加强。因为这场比赛对双方同样重要。相反，假如奥斯本第一次触底得分后就尝试得2分的策略，那么在一定程度上确实存在激励效应，从而提高第二次触底得分的概率。这也使他可以通过两个3分的射门打平。书　包　网　txt小说上传分享

公平和利他主义的演化（5）
从这个故事中可总结的教训之一是，如果你不得不冒一点风险，通常是越早冒险越好。这一点在网球选手看来再明显不过了：人人都知道应该在第一次发球的时候冒风险，第二次发球则必须谨慎。这么一来，就算你第一次发球失误，比赛也不会就此结束。你仍然有时间考虑选择其他策略，并借此站稳脚跟，甚至一举领先。越早冒险越好的策略同样适用于生活中的大多数方面，无论是职业选择、投资还是约会。
　　更多关于向前展望、倒后推理原理的实际运用，请看第14章的一些案例分析：“祝你好运”、“红色算我赢，黑色算你输”、“弄巧成拙的防鲨网”、“硬汉软招”、“三方对决”和“糊涂取胜”。妙趣横生博弈论第3章囚徒困境及其克服第3章囚徒困境及其克服
　　多种情景，一个思想
　　以下的情景有何共同点？
　　　位于同一个街角的两家加油站，或者同一片街区的两家超市，有时会彼此展开激烈的价格战。
　　　在美国大选活动中，*党与共和党通常都会采取中间政策，以吸引那些处于政治光谱中翼的选民，却忽略了他们那些分别持极“左”或极右态度的核心支持者。
　　　“新英格兰渔业的多样性和生产力曾经是无可匹敌的。然而在过去的一个世纪，由于过度捕捞而最终导致物种相继灭绝已成为一种趋势。大西洋比目鱼、海鲈、黑线鲟和黄尾比目鱼……（均被列入了）商业灭绝的物种行列。”
　　答对了也没有奖励——毕竟，囚徒困境是本章讨论的主题。但是，正如我们在第2章中所做的，我们借此机会指出，博弈论的一般概念性框架，可能有助于我们理解各种各样的变体以及看似无关的现象。我们还应该指出的是，毗邻的商店并不经常忙于打价格战，政党们也并非总是围绕权利中心而战。事实上，分析和说明这类博弈中的参与者如何能避免和解决困境，才是本章的一个重要部分。　在约瑟夫·海勒（Joseph　Heller）的著名小说《第22条军规》结尾，第二次世界大战胜利在望。尤塞里安不想成为胜利前夕最后一批牺牲者，因为这对于战争结果毫无影响，他向上司丹比少校解释道。丹比问：“可是，尤塞里安，如果大家都这么想呢？”尤塞里安答道：“那么，我若是不这么想，岂不就成了大傻瓜？”
　　答案：这些都是囚徒困境的实例。就像《冷血》第1章中讲述的对迪克·赫克考克和佩里·史密斯的审讯，当人人都按照自己的个人利益行事时，每个人都有其个人动机，最终采取了对各方都不利的行为。若其中一个人坦白，那么另一个人最好也坦白，以免因抗拒从严而遭到严厉判决；反之，若其中一个人坚持沉默，另一人却可以通过坦白从宽大大减轻自己的刑罚。的确，促使坦白的力量实在太强大了，以至于每个囚徒都有坦白的动机，不论双方是真有罪（正如《冷血》中的情况），还是明明无罪却被警方诬陷（正如电影《洛城机密》中的情况）。
　　价格战也是一样。如果奈克森加油站的汽油定价较低，那么卢纳科加油站最好也降低自己的价格，以免失去太多的顾客；如果奈克森加油站的汽油价格较高，那么卢纳科加油站可以通过制定低价，将奈克森加油站的一些顾客吸引过来。但是，当两家加油站的价格都较低时，它们谁也不会盈利（虽然顾客的情况得到了改善）。
　　在美国大选中，如果*党采用吸引中间派的竞选策略，那么，共和党要是只迎合他们那些处于经济和社会右翼的核心支持者，就很可能失去这些中间派选民的支持，从而导致大选失败；反之，如果*党只迎合其在少数民族和工会中的核心支持者，那么共和党可以通过采取更加中间的态度，赢得中间派的支持，从而赢得绝大多数的选票。在过度捕捞案例中，如果所有其他人都有节制地捕捞，那么单凭一个渔民的过度捕捞并不会在很大程度上造成渔业的消耗殆尽；但是，如果所有其他人都过度捕捞，那么任何一个试图单枪匹马保护渔业的渔民都是傻瓜。这样，最终结果就会是过度捕捞和物种灭绝。而在《第22条军规》中，尤塞里安的逻辑，正是使得人们很难继续支持一场败仗的原因。
　　一段小小的历史
　　对于这个涵盖了经济、政治和社会诸多活动的囚徒困境博弈，理论家们当时是如何构造和命名的呢？这要追溯到博弈论学科早期的历史。作为博弈论先驱之一的哈罗德·库恩（Harold　Kuhn）在1994年诺贝尔奖颁奖典礼的专题讨论会上，讲述了下面的故事。那是1950年春天，埃尔·塔克（Al　Tucker）在斯坦福大学学术休假，由于办公室紧缺，他住进了心理学系。有一天，一位心理学家敲开了他的房门，问他正在做什么。塔克回答：“我正在研究博弈论”，心理学家就问他能否就他的研究举办一次研讨会。为了那次研讨会，塔克发明了“囚徒困境”作为博弈论、纳什均衡以及与之伴随而来的非社会意愿均衡的例子。作为一个真正富有创意的例子，囚徒困境博弈激发了许多学术论文乃至几本巨著。其他人的说法则略有不同。据他们所说，囚徒困境的数学架构早在塔克之前就形成了，这可以归功于两位数学家，即就职于兰德公司（美国冷战时期的智囊团）的梅里尔·弗勒德（Merrill　Flood）和梅尔文·德雷希尔（Melvin　Dresher）。塔克的才华在于，他发明了这个故事来阐释数学原理。之所以称它为一种才华，是因为它的展示方法可以形成或者打破一种思想；一种令人难忘的展示方法能够传播开来，并被大多数思想家更好更快地吸收，而一种乏味枯燥的展示方法可能会被人忽略、遗忘。
　　　电子书　分享网站

一个直观的展示
我们用一个商业实例，来提出表示和求解该博弈的方法。彩虹之巅（Rainbows　End）和比比里恩（BBLean）是两家互为竞争对手销售服装的邮购公司。每年秋天，它们都要打印出其冬季产品目录单，并邮寄出去。且每家公司都必须遵守其产品目录上印刷的价格。由于产品目录的准备时间比邮购窗口开放的时间长得多，因此，两家公司必须在不知道对方价格的情况下，同时做出定价决策。它们很清楚，产品目录是给一些共同的潜在顾客看的，而这些顾客很聪明，他们不断追求低廉的价格。
　　这不仅包括了从中国供应商那里购买衬衫的成本，也包括运送至美国的运输成本、出口税以及存货成本和订单履行成本。换句话说，总成本包括所有与该产品相关的成本。这样规定的目的是为了全面度量经济学家所谓的边际成本。两家公司的产品目录上通常都重点突出一件几乎完全相同的商品，如高档格子衬衫。对每家公司而言，该衬衫的单位成本为20美元。它们估计，如果它们都对这种商品定价80美元，那么，每家公司将销售出1　200件衬衫，这样，每家公司都将得到（80－20）×1　200＝72　000美元的利润。而且，事实证明，这个价格能使它们的共同利益最大：如果两家公司合谋起来，统一定价，那么80美元是使他们的联合利润最大化的价格。
　　这两家公司还估计出，如果其中一家公司把价格降低1美元，而另一家的价格保持不变，那么降价的公司将得到额外的100名顾客，其中80名是从另一家公司转移过来的顾客，20名是新顾客。他们可能决定买下价格较高时未买的衬衫，也可能从当地购物中心的某个商店转移到这家公司。因此，每家公司都有动机制定低于对方公司的价格，以得到更多的顾客；我们给出这个故事的主要目的在于，找出这些动机是如何影响双方的行动的。
　　首先，我们假设每家公司只有两个价格选择：80美元和70美元。如果一家把它的价格降至70美元，而另一家公司仍然定价80美元，那么，降价者将得到额外的1　000名顾客，而另一家则失去800名顾客。这样，降价者售出　2　200件衬衫，而另一家的销售量降到400件；降价者的利润为（70－20）×2　200＝110　000美元，而另一家公司的利润为（80－20）×400＝24　000美元。
　　这个规定，尤其是只有两种可能的价格选择这个假设，只不过是为了以尽可能简单的方式，构造出这类博弈的分析方法。在以后的章节，我们将允许公司有更大的价格选择自由。
　　托马斯·谢林在区分哪个赢利属于哪个参与者时，发明了这种用同一个表格表示两个参与者的赢利的方法。他用过分谦虚的笔触写道：“假如真有人问我有没有对博弈论做出一点贡献，我会回答有的……我发明了用一个矩阵反映双方赢利的方法。”事实上，谢林提出了很多在博弈论中至关重要的概念——聚焦点、可信度、承诺、威胁与承诺、颠覆，等等。在接下来的章节中，我们将会经常引用他和他的研究成果。如果两家公司都把价格降至70美元，结果会怎么样？如果它们都降价1美元，虽然现存的顾客数量不变，但它们各自都得到了20名新顾客。这样，当它们都把价格降低10美元时，就能各自在原先1200件的基础上多销售200件。即每家公司的销售量是1　400件，获得的利润为（70－20）×1　400＝70　000美元。
　　我们希望能够直观地展示出利润结果（即公司在博弈中的收益）。但是，我们无法运用第2章中的博弈树来做到这一点。因为在这里，两个参与者是同时行动的。参与者在采取行动时，都不知道对方做了什么，也预料不到对方将如何回应。相反，每个人都要考虑对方同时在想什么。这种想对方之所想的做法的一个出发点是，列出双方所有同时选择组合的所有结果。因为每家公司各有两个价格选择：80美元或70美元，所以总共存在四个这样的组合。我们可以用一种由行和列组成的类似电子表格的形式简单地把它们表示出来，通常我们称之为博弈表或者赢利表。彩虹之巅（简称RE）的选择表示在行中，比比里恩（简称BB）的选择表示在列中。在这四个单元格中的每个单元格，我们都展示了与每个RE行选择和BB列选择相对应的两个数字——衬衫的销售利润，单位是千美元。在每个单元格中，左下角的数字属于行参与者，右上角的数字属于列参与者。在博弈论术语中，这些数字称为赢利。同时，在这个例子中，为了清楚地区分哪些赢利属于哪个参与者，我们把这些数字用两种不同的阴影表示出来。
　　一般来说，对参与者而言，赢利数字越高越好。有时则不然。比如对接受审讯的囚徒而言，赢利数字指的是监禁的期限，因此每个参与者都希望数字更小。同样的情况也适用于赢利数字代表排名时，在那里，1是最佳结果。当你观察一个博弈表格时，你应该先弄明白该博弈的赢利数字的含义。在“求解”这个博弈之前，让我们先来观察并强调一下该表格的一个特性。比较一下这四个单元格中的赢利组合。对RE而言较好的结果，并不总是意味着对BB而言是较坏的结果，反之亦然

《妙趣横生博弈论》

下载本书

妙趣横生博弈论- 第11部分