《女士品茶》

下载本书

添加书签

女士品茶- 第8部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
捍跬骄兰傻摹K壮啤昂稚蓝印保˙rown Shirts)的纳粹冲锋队是一个专门从事恐吓与胁迫、恣意暴力和谋杀来执行纳粹党意志的暴徒组织。任何批评纳粹党的人都会遭到暴力攻击,而且通常就发生在城市的大街上,以杀一儆百。冈贝尔有个朋友就是这样在光天化日之下曹到攻击并被公然杀害的。照理说,会有许多目击证人可以指认凶手,但法院往往宣称罪证不足而使纳粹突击队逍遥法外。
冈贝尔曾参加过一场审判,他亲眼目睹了法官全然无视任何证据,恣意裁决,纳粹党徒则在法庭上肆无忌惮地狂呼。对此,冈贝尔惊骇万分。于是,他开始着手调查那些凶手公然行凶的其他案例,结果没有一例被判有罪。最终他得出结论:司法部门已经被纳粹党人所控制,很多法官要么是纳粹的支持者,要么干脆就是纳粹所雇佣的。
冈贝尔搜集了许多案例,走访证人,证明判决那些凶手无罪是错误的。1922年,他出版了《四年的政治谋杀》(Four Years of Political Murder)一书,把他搜集调查的结果公之于众。由于发现很多书商根本不敢销售他的书,他不得不亲自去为自己的书安排发行分销。与此同时,他还在继续搜集案例,并于1928年又出版了《政治谋杀的原因》(Causes of Political Murder)一书。此外,他还设法成立一个反纳粹的政治团体,但是他的多数学术界同事太害怕了,甚至那些犹太籍的朋友们都吓得不敢参加。
1933年纳粹党取得了政权,当时冈贝尔正在瑞士参加一个数学会议。他本打算立即赶回德国去与这个新政权做斗争,但朋友们极力劝阻了他,因为只要他一越过边境,就会立刻遭到逮捕,并被处决。在纳粹掌权的最初阶段,在这个新政府还没来得及控制所有的出入境事务之时,少数犹太籍教授,如德国的顶尖的概率论大师里夏德?冯?米泽斯(Richard Vin Mises),他们已经预料到即将发生的灭顶之灾,提前逃离了德国。冈贝尔的朋友也趁这段有利的混乱时机,带着他的家人离开了德国。他们跑到法国暂避一时,但是,1940年纳粹又入侵了法国。
冈贝尔与家人继续逃往尚未沦陷的法国南部。当时统计法国的是纳粹扶植的傀儡政府,对德国惟命是从。像冈贝尔这样的德国民主党人已经是危在旦夕,因为他们都被列入了叛国者的黑名单,纳粹要求法国政府将这些人移交过去。除了冈贝尔,滞留在法国马赛的德国逃亡者还有德国作家托马斯?曼(Thomas Mann)的哥哥海因里希?曼(Heinrich Mann)、犹太裔小说家利翁?福伊希特万格(Lion Feuchtwanger)。当时驻马塞的美国领事海勒姆?宾厄姆四世(Hiram Bingham IV)违反美国国务院的规定,擅自给这批德国流亡者发了签证。宾厄姆为此受到华盛顿的谴责,最终由于此举而丢掉了他在马赛的职位,但宾厄姆毕竟尽他所能拯救了很多人,这些人如果留在纳粹统计下,将必死无疑。冈贝尔与家人到了美国之后 ,在哥伦比亚大学谋到一个职位。
数学著述有很多种不同的写法。有此所谓“权威”教科书,内容贫乏、苍白、毫无生气,提出一系列的定理及证明,却几乎引不起读者的任何兴致;有此书通篇是从假设到结论的证明,玄虚而艰涩;而有此权威的教科书,则由始至终充满了精彩的证明,其中的数学推导过程被浓缩成看上去很简单的步骤,按照这些步骤可以毫不费力地得出最终结论;还有极少量的权威性的教科书,作者试图在书中把问题的背景和思想都交代清楚,不仅记述了学科的历史渊源,而且所举的例子也取自生动的现实生活。
最后一类所说的权威性教书的这些牲恰是对冈贝尔的《极值统计学》一书的真实描述。这本书提供了大量有关该学科发展的参考,是对一个高难学科的最为明晰的解释。该书的第1章“目录与手段”介绍了该书的主题以及在其他章节中必须理解的数学的发展。这一章本身就是对统计分布理论的数学知识的最卓越的介绍。它的设计思想是让那些只读过大学一年级微积分的学生能看得懂。我第一次读这本书的时候,尽管已经拿到了数理统计博士学位,还是从第一章中获准颇多。作者在前言中谦虚地说:“我期望,而决不是预料,本书的写作能使人类从中获益,哪怕是因为对科学进步的微不足道的贡献。”
这本书的贡献决不能称之为“微不足道”,它是由20世纪一位大师级的教师矗立的一座丰碑。集非凡的胆识与杰出的表达能力于一身,把最难理解的思想以条理清晰、简洁精炼的方式表达出来,埃米尔?J?冈贝尔正是这些极为罕见的杰出人才当中的一位。
第7章 费歇尔获胜
英国皇家统计学会(The Royal Statistical Society)拥有三种可以发表论文的学术期刊,每年学会还主办学术会议,会上邀请演讲者介绍他们最新的研究工作。论文要在这些期刊上发表是相当困难的,必须经过至少两位评阅人的审查,看内容是否正确,而且编辑与主编都必须认为该篇论文代表了当时在自然科学领域的显著进展。但是,与应邀在大会上演讲相比,在学会期刊上发表论文就显得容易多了。大会演讲,这只是留给那些在统计学领域里最杰出的研究人员的一种荣誉。
每一次应邀演讲结束之后,按照学会的惯例,都会组织一场与会者参加的讨论会。由于特邀的会议来宾已经预先拿到了将在大会上演讲的论文副本,因此他们的讨论常常不但详尽,而且一针见血。之后,这篇论文连同讨论会上对论文的评论意见都会发表在《皇家统计学会期刊》上。
这种讨论会,正如在期刊上所展现的,有一种非常程序化的英国风格。大会主席(或某个被指定的人)首先站起来提议向演讲人表示感谢,紧接着陈述他的评论。随后,一位事先指定的皇家统计学会的资深会员直立再次提议表示感谢,并随之发表他的评论。接下来,学会中一些最负声望的会员一个接一个地相继站起来发表他们的评论。除了学会的会员之外,大会还经常邀请一些来自美国、英联邦和其他国家的来宾,也请他们发表评论。演讲人再对所有的评论做出回应。最终,学会期刊允许评论人及主讲者对属于他们自己的那部分文字进行编辑之后才正式发表。
1934年12月18日,在学会会议上宣读这样一篇论文的无上荣誉赋予了理学博士、英国皇家学会会员费歇尔教授。经过了20世纪20年代事实上的孤立之后,费歇尔的天赋终于得到了公认。我们在前几章里读到他的时候,费歇尔的最高学位还只是个理学硕士(M。S。),他的“大学”也不过是伦敦郊外一个偏僻的农业试验站。到1934年,他又获得了一个理学博士学位,并且当选为威望很高的英国皇家学会的会员(缩写为F。R。S。)。直至此时,皇家统计学会才终于承认了他作为这个领域中的领军人物,应该占有一席之地。因为这项荣誉,费歇尔在大会上宣读了一篇论文,题为《归纳推理的逻辑》(The Logic of Inductive Inference)。大会主席是皇家统计学会当时的会长。皇家学会会员M?格林伍德(M。 Greenwood)教授。费歇尔的论文印出来共计16页,另外还呈上一份结构严谨、条理清晰的论文摘要,概括了他最新的研究工作。第一位发言的评论人是A?L?鲍利(A。 L。 Bowley)教授,他站起身来提议表达谢意,接着发表了他的感言:
我很高兴有这样一个机会向费歇尔教授表示感谢。不仅是因为他刚才为我们宣读的论文,更重要的是因为他对统计学的全面贡献。今天借此良机,我谨代表所有我熟悉的统计学家,对他带给统计学研究的无与伦比的热忱,对他提出的数学工具的威力,对他在这里、在美洲和在世界各地的广泛的影响力,以及对他深信做为数学的正确应用所发挥的激励作用表示钦佩之意。
K?皮尔逊当时不在讨论者之列。此前3年,他已从他任职的伦敦大学退休。在他的领导下,高尔顿生物统计实验室已经成长为大学里一个正式的生物统计学系。他退休后,该系一分为二,费歇尔受命担任其中之一的优生学系的系主任,另一个则是规模缩小了的生物统计学系,系主任由K?皮尔逊的儿子E?皮尔逊担任,同时他还负责高尔顿实验室的工作,并兼任《生物统计》杂志的编辑。
费歇尔与小皮尔逊的私交不大好,这完全是费歇尔的过错。他对E?皮尔逊的态度带着显而易见的敌意。小皮尔逊这位温文尔雅的先生,一则是代父受过,因为费歇尔不喜欢他的父亲老皮尔逊;二则是代合作伙伴耶日?奈曼受过,费歇尔特别讨厌奈曼(奈曼与E?皮尔逊的合作将在第10章介绍)。尽管如此,小皮尔逊倒是极其尊重并高度评价费歇尔的工作。多年后他曾写道,他早就习惯了费歇尔从不在著述中提到他的名字。但是,尽管两人之间关系紧张,尽管两系之间存在着争夺权限的纠纷,费歇尔和E?皮尔逊都清寒是派学生去听对方的课,竭力避免公开的冲突。
至于K?皮尔逊,此时的他已被学生们称之为“老家伙”了。他拥有一个研究生助手,并保留着一间办公室,但他的办公室无论离两个系的办公地点还是离生物统计实验室,都有一段距离。从美国来的邱吉尔?艾森哈特跟随费歇尔和E?皮尔逊进修一年,这期间他曾想去拜访K?皮尔逊,但他的同学和系里的同事都极力劝阻他。问他,为什么不去请教才华横溢的费歇尔,竟然想去看K?皮尔逊?去看那个老家伙能有什么新的收获?令艾森哈特万分遗憾的是,他在英国期间未曾去拜访K?皮尔逊,而就在那一年老皮尔逊去世了。

费歇尔学派与皮尔逊学派:两种统计观
哲学上的分歧使费歇尔与K?皮尔逊在研究统计分布的方法上分道扬镳。K?皮尔逊把统计分布视为对他所分析数据的集合的真实描述。而按照费歇尔的观点,真实分布只是一个抽象的数学公式,搜集的数据只能用来估计这个真实分布的参数。既然所有的估计都有误差,那么费歇尔提出来的一些分析的手段,可以把这种误差的程度降到最低,或者可以更经常地得出比其他任何手段都更接近真实分布的答案。
在20世纪30年代,看上去是费歇尔在这场辩论中获胜了,但到了70年代,皮尔逊学派的观点东山再起。直到写这本书时,统计学界在这个问题上已经分裂成两派,尽管K?皮尔逊本人几乎不接受他的天才继承者们的观点。费歇尔用他条理清晰的数学头脑廓清了残存在K?皮尔逊观点中大量的混淆,正是这些混淆使得K?皮尔逊没有意识到自己观点的深层本质,因此,后来东山再起的皮尔逊方法已经无法回避费歇尔的理论成果。当把统计模型应用于现实时,存在着一些很严重的问题。因此,本书打算在多处探讨这些哲学问题,这里就是其中的一处。
K?皮尔逊把测量值的分布视为一个真实的存在。在他的方法里,对于一个给定的情况,有一个庞大的然而却是有限的(finite)测量值的集合。在理想情况下,科学家会搜集所有的这些测量值,并确定其分布参数。如果无法搜集到全部测量值,那么就搜集一个很大的并且具有代表性的数据子集(subset)。由这些大量的、且具代表性的子集计算出来的参数会与完备集合的参数相同;此外,那些用来计算完备集合参数值的数学方法也适用于有代表性的子集的参数估计,而不会有严重的误差。
但依照费歇尔的观点,测量值是从所有可能出现的测量值中随机选取的,依据随机选取的数据计算得出的一个参数的任何估计值,其结果本身也具有随机性,因此,也会服从一种概率分布。为了能清楚地区分参数的估计值与参数本身这两个不同的概念,费歇尔把这个估计值称为“统计量”(statistic);不过现代术语往往称其为“估计量”(estimator)。假设我们有两种不同的方法可以得到一个统计量,以估计某个特定的参数。例如老师想了解一个学生对知识掌握到什么程度(参数),就在全班进行了几次测验(测量),并且计算出测验的平均分数(统计量)。那么,究竟是用中位数(median)作统计量“更好”呢,或是取这几次测验中的最高分与最低分的平均值“更好”呢,还是去年最高分与最低分然后把其余的测验成绩加以平均“更好”?
既然统计量是随机的,那么讨论这个统计量的某个值的准确性到底有多大是毫无意义的。我们需要的是一个判别的准则,这个准则以统计量的概率分布为依据,就像K?皮尔逊所指出的那样,对一组测量进行估计,必须根据它们的概率分布,而不是根据个别观测值。评判哪一个是好的统计量,费歇尔提出了如下三个准则:
一致性(consistency):得到的数据越多,计算出来的统计量接近参数真值的概率就越大;
无偏性(unbiasedness):如果用很多组不同数据集多次测量某一特定的统计量,那么该统计量的这些测量值的平均数应该近似于这个参数的真值;
有效性(efficiency):统计量的值不会完全等于该参数的真值,但是用来估计一个参数的大多数统计量应该与真值相去不远。这些阐述似乎有点含混不清,这是因为我在竭尽全力地把一些本来精确的数学公式,用一些一般性的文字表述出来。实际上,费歇尔的这些准则都可以用恰当的数学式来表达。
费歇尔之后的统计学家又提出了其他的准则,费歇尔自己也在后来的论文中提出了一些次要准则。剔除所有这些准则中的混乱不清的东西之后,剩下的最重要的元素就是,应该把统计量本身视为随机的,而好的统计量一定有好的概率特性。对于某一特定数据集,我们永远不知道一个统计量的值是否正确,只能说我们用一种方法得出来一个符合这些准则的统计量。
在费歇尔提出的三项基本准则中,“无偏性”准则最引人关注,这或许是由于“偏误”(bias)这个词带有某种贬义。一个有偏的(biased)统计量似乎是谁都不想要的某个东西。美国食

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架