为笔名发表了论文,提出了后来几乎在所有现代科学工作中都有作用的研究成果——“学生”的“t检验”。接下来的几章我们还会遇到这位匿名的作者,并将讨论他在K?皮尔逊与费歇尔之间作调解时的不幸角色。
高尔顿死于1911年,而韦尔登则于这之前死于阿尔卑斯山的一次滑雪事故。只剩下了K?皮尔逊这唯一的编辑和信托基金的支配者。在接下来的20年中,期刊成了K?皮尔逊个人的了,期刊发表什么完全以K?皮尔逊的判断为准,由他确定重要与否。K?皮尔逊为期刊写了很多社论,他让自己丰富的想象驰骋在各个领域。比如,在对一个古老的爱尔兰教堂翻修时,墙壁中发现了一副骨骼,K?皮尔逊通过对这些骨骼的测量和所涉及的数学推理,来确定它们事实上是不是某个中世纪圣徒的遗骨。再比如,一个据称是奥利弗?克伦威尔(Oliver Cromwell)的头骨被发现了,K?皮尔逊以一篇精彩的文章对其进行了研究。该文描述了所知的克伦威尔尸体的下落,并且还将对克伦威尔画像所做的测量结果和该头骨 所做的测量进行了比较。在另外一些论文中,K?皮尔逊检验了古罗马各君主的统治期和贵族阶级的没落,还涉猎了社会学、政治学和植物学。所有这些,都带有复杂的数学解释。
就在去世之前,K?皮尔逊还发表了一篇题为“论犹太人与非犹太人关系”(On Jewish – Genlile Relationships)的短文。文中他分析了从世界各地收集到的犹太人与非犹太人的人体测量数据,最后得出的结论是:德国国家社会主义(the National Socialists)(正式的名称是纳粹(Nazis))的种族理论纯粹是胡说八道,根本就没有犹太种族(Jewish race)或亚利安种族(Aryan race)那回事。这最后一篇论文与他以前的工作一样,组织清晰,有逻辑性,推理谨慎。
K?皮尔逊运用数学研究了人类思想的许多领域,而很少有人将这些领域视为科学的正宗地盘。浏览生物统计上他所写的社论,你仿佛看到了一个兴趣十分广泛的人,他具有直切问题核心的惊人能力,并能用数学模型去加以处理。还有浏览这些社论,你就像遇上一个意志坚定、主见鲜明的人。说实话,如果不需要与他争辩的话,我想我是很乐意与K?皮尔逊共处一天的。
K?皮尔逊他们是否证明了达尔文适者生存的进化论理论呢?也许是吧。通过将古墓中头骨的容量分布与现代男女的比较,他们设法证明:经历了几千年深化的人类种群保持了相当的稳定。他们表明:对澳洲原住民的人类学测量与对欧洲人的测量结果有着相同的分布,据此,他们推翻了某些澳洲人关于原住民不是人类的断言。K?皮尔逊从这些工作中发展了一种被称为“拟合优度检验“(goodness of fit test)的基本统计工具,这是现代科学所不可缺少的。它使科学家能够确定一组给定的观测值是否适合于某一特定的数学分布函数。在第10章我们会看到,K?皮尔逊的儿子E?皮尔逊(Eqon Pearson),是如何用这种拟合度检验是否定他父亲所完成的许多项工作的。
随着20世纪的来临,《生物统计》中讨论数理统计理论问题的文章越来越多,少量的文章仍停留在处理特定数据的分布。当K?皮尔逊的儿子E?皮尔逊接班成为编辑时,期刊的性质就完全转型为理论数学了。时至今天,《生物统计》仍是这个领域中卓越的刊物。
但他们到底有没有证明适者生存这个说法呢?20世纪初曾经有一个最接近的研究。韦尔登构想了一项宏大的实验:18世纪英格兰南部瓷器工厂的发展,导致了一些河道被粘土淤塞,普利茅斯(Plymouth)港和达特茅斯(Dartmouth)港也都受到了影响,近陆地区比近海地区淤得更为严重。韦尔登从这些港口抓了几百只螃蟹,分别放入广口瓶中,其中一半用内港的淤泥水,另一半用外港的较干净的水。一段时间后仍有螃蟹存活,韦尔登测量它们的壳,以确定两组螃蟹的分布参数。
正像达尔文所预言的那样,淤泥水中戚的螃蟹在分布参数上有了变化!这是不是证明了进化论呢?不幸的是,韦尔登在写出实验结果前就死了,K?皮尔逊对数据进行了粗略的分析,他描述了这个实验及其结果,但最后的分析却始终没有搞出来。为这项实验提供资助的英国政府要求提供最终报告,但报告了无踪影,韦尔登死了,实验也夭折了。
就生命周期很短的生物,如细菌和果蝇而言,达尔文的理论最终被证明是真实的。用这些物种,科学家可以在较短的一个时间段里完成几千代的实验。现代的DNA研究,作为遗传的基石,已经为物种之间的关系提供了更为有力的证据。如果我们假定突变率在过去千万年或更长的时间里保持不变,那么DNA的研究可以用来估计灵长类和其它哺乳动物出现的时间框架,至少它经了几百万年。大多数科学家现在都把达尔文的进化论作为正确的东西接受下来。没有其它理论与所知数据吻合的如此之好,于是科学界满足了,原来人们认为需要通过确定分布参数转变来表明较短时间里的进化过程,一日三餐这种观念已经被放弃。
K?皮尔逊的革命所留下来的是这样一个观念:科学的对象并不是不可观测事物本身,而是数学分布函数,以描述与所观测事物相联系的概率。今天,医学研究运用精巧的分布数学模型来确定治疗方法对长期存活的可能效果;社会学家和经济学家用数学分布来描述人类社会的行为;物理学家用数学分布来描述次原子粒子。科学里没有哪一个方面从这场革命中逃脱。有的科学家宣称,概率分布的使用只是一时的权宜之中,最终我们会找到一种途径回到19世纪科学的决定论。爱因斯坦有句名言,他不相信上帝在和宇宙玩骰子,就是这种观点的例子。其他人则相信,大自然基本上是随机的,真实性只存在于分布函数之中。不管一个人的基本哲学是什么,事实仍然是,K?皮尔逊关于分布函数和参数的思想统治了20世纪的科学,并在21世纪初仍保持着优势。
第3章 可爱的戈塞特先生
爱尔兰都柏林的吉尼斯酿造公司(Guinness Brewing pany)是一个声誉卓著的老牌酿造公司,该公司于20世纪初开始投资于科学。年轻的吉尼斯刚刚继承这家企业,他就决定雇用牛津和合格大学在化学上顶尖的毕业生,以便将现代科学技术引进到公司的业务中来。在1899年,他招募威廉?西利?戈塞特(William Sealy Gosset)进入公司,那是个23岁的牛津大学新秀,拥有化学和数学两个学位。戈塞特的数学背景在当时是传统的,包括微积分、天文学和机械式宇宙观下的其它科学分支,K?皮尔逊的创新和后来成为量子力学的萌芽观念,还没有进入大学的课程。戈塞特是由于他的化学专长而被吉尼斯雇用的。对一个酿酒企业来说,要一个数学家又有什么用呢?
戈塞特成为吉尼斯一项很好的投资,他表明自己是一个很能干的管理者,最后他在公司里升任负责大伦敦区业务的主管。事实上,他对本行工艺做出了第一项主要贡献是以数学家的身份来完成的。几年前,丹麦电话公司(the Danish telephone pany)是第一个雇用数学家的实业公司,但他们有一个明确的数学问题:制造多大的电话交换板?可制造啤酒又有什么数学问题需要解决呢?
戈塞特在1904年发表了第一篇文章,处理的是这样一个问题:麦芽浆准备发酵的时候,需要仔细地测量所用酵母的量,酵母是活的有机体,酵母培育需要保持鲜活,加入麦芽浆前它在瓶中的液体里系列。工人们得到测量清楚某个给定的瓶中有多少酵母,以便决定用多少液体,它们提取一定量的液体,在显微镜下检验,计量他们所看到的酵母细胞数。这种测量有多精确?了解这一点是很重要的,因为麦芽浆中所用的酵母数应该精确地控制。酵母太少,发酵不充分;太多了,啤酒又会发苦。
注意这个问题与K?皮尔逊对科学的观念是多么的吻合。测量的是样本中酵母细胞的量,但所寻求的真实“东西”是整个瓶中酵母细胞的浓度。由于酵母是活的,而细胞不断地分裂和繁殖,那个“东西”实际上并不存在,在某种意义上,真正存在的是单位液体中酵母细胞的概率分布。戈塞特检验了数据,确定酵母细胞的数量可以用所知的泊松分布(Poisson distribution )来描述,这并不是K?皮尔逊偏斜分布家族中的一种概率分布。事实上,它是一种只有1个(而不是4个)参数的特殊分布。
确定了样本中的活酵母细胞数服从泊松分布,戈塞特就能够设计规则和测量方法,从而得到对酵母细胞浓度更为精确的测量。用戈塞特的方法,吉尼斯能够生产质量更稳定的啤酒。
“学生”的诞生
戈塞特想找一份适合的期刊发表这个结果,泊松分布(或相应的公式)已经被发现100多年了,过去一直试图在现实生活中寻找实例,其中之一,便是计量普鲁士军队中被马踏死的士兵人数。在酵母细胞计量中,戈塞特有一个清楚的实例,还有对统计分布新观念的重要应用。然而,这违背了公司不准许雇员发表文章的政策。几年前,吉尼斯一位优秀的酿造师写了一篇文章,其中泄露了他们某个酿造过程的秘密成份。为了避免进一步损失,吉尼斯禁止它的雇员发表文章。
戈塞特成了当时《生物统计》编辑之一的K?皮尔逊的好朋友,而K?皮尔逊对戈塞特的数学能力印象很深。1906年,戈塞特说服了他的老板,数学的新思想对啤酒公司是很有用的,并到高尔顿生物统计室在K?皮尔逊门下脱产学习一年。这之前两年,当戈塞特描述他处理酵母的结果时,K?皮尔逊急于将之付印于他的期刊。他们决定用匿名的方式发表文章,于是,戈塞特的首次发现是仅是以“学生”的名义发表的。
在其后30年中,“学生”写了一系列极为重要的论文,几乎所有的都发表在《生物统计》上。从某些方面看,吉尼斯家族已经发现了他们“亲爱的戈塞特先生”违反了公司的规定,一直私下里撰写并发表科学论文。“学生”的数学活动大多是在家里进行,并且是在正常的工作时间之外。戈塞特在公司升迁到了负更多责任的位置,这表明他的副业并没有使吉尼斯公司受损。有这样一种不足为凭的说法:吉尼斯家族第一次知道这件事是在1937年,戈塞特突然死于心脏病,他数学界的朋友与吉尼斯公司探讨,想帮助支付其论文集的印刷成本。不管这事真实与否,美国统计学家哈罗德?霍特林(Harold Hotelling)的回忆录里清楚地记载,霍特林在20世纪30年代后期要与“学生”会谈,安排是秘密的,带有间谍小说的各种情节。这表明“学生”身份的真正确认,对吉尼斯公司仍是个秘密。“学生”在《生物统计》发表的论文涉及理论和实践的尖端问题,戈塞特将非常实际的问题带入有难度的公式,又把结论带回现实实践,后来者便照此办理。
尽管有很高的成就,戈塞特仍是个谦逊的人。在他的信中,人们经常可以发现这样的字眼:“我的研究只是提供了粗浅的想法”;或者,当他的某些发现被给予过多的荣誉,他会说:“费歇尔实际上已经能完成了整个数学结构。”在人们的记忆中,戈塞特是一个和善的、体贴的同事,很在意别人的情感。他去世的时候61岁,离开了他的妻子马乔里(Majory)(一个精力充沛的运动员,曾经担任英国女子曲棍球队的队长)、一个儿子、两个女儿和一个孙子,当时他的父母还健在。
“学生”的t检验
如果不算别的,所有的科学家都受惠于戈塞特的一篇短文,该文的题目是“平均数的可能误差”(The Probable Error of the Meam),1908年发表在《生物统计》上。是费歇尔点出这篇杰出论文的一般性意义。对戈塞特来说,有一个特定的问题需要解决,一到晚上,他就习惯性地带着耐心和小心投入于这个问题。发现了结论,他就用其它资料来检查,重新验证他的结果,努力去确认是否遗漏了什么细微的差别,考虑他必须设定哪些假设,并一再重复计算自己的发现。他提前采用了现代计算机基础上才出现的蒙特卡罗技术(Monte Carlo techniques);这是一种一再模拟的数学模型,以确定相关数据的概率分布。然而,当时他没有计算机,只能不辞辛苦地加总数据,从上百个样本中计算平均数,并绘制所得出频率的图表,所有这些都靠手工完成。
戈塞特所专注的特定问题是小样本(small sample)问题。K?皮尔逊计算了某一分布的4个参数,这是在单一样本就积累了上千个测量数据的基础上完成的,因为使用了大样本,他设定所得到的参数估计是正确的。费歇尔要证明他的错误。根据戈塞特的经验,科学家很少能三八线以有如此大的样本,更为典型的实验通常能够看到10到20个观测数据,他还理解到,这种现象在所有的学科中都很普遍。在一封给K?皮尔逊的信中,他写道:如果我是你遇到的用小样本工作的唯一一人,那你太特异了,在这个题目上我与斯特拉顿(Stratton)(剑桥大学的一位研究员)相伴,他曾经用4个样本来做说明。
K?皮尔逊所有的工作都假定:样本足够大,以至于确定参数可以没有误差。戈塞特设问:如果是小样本会怎么样?我们将如何处理自己的计算中肯定会出现的随机误差?
晚间,戈塞特坐在自己的餐桌旁,取出一小组数据,算出平均值和标准差估计值,再将二者相除,并将结果绘在图纸上。他发现这个比率与K?皮尔逊的四个参数相关,并与K?皮尔逊的偏斜分布系列中的某一分布相配。他的伟大发现在于:你不必知道原始分布的4个参数的确切值。前两个参数估计值的比率有一个可以制表的概率分布,不管数据从哪里来,或者标准差的真实值是多少,计算这两个样本估计值的比率,你就可以得到一个已知的分布。
正如弗雷德里克?莫斯特勒(Frederick Mosteller)和约翰?图基(Joh