论文汇集成了5卷,所写的7本著作仍然对统计学的发展产生着影响,然而他卓著的原创性贡献却到此为止了。
第18章 吸烟会致癌吗?
1958年,费歇尔在《百年回顾》(Centennial Review)中发表了一篇题为《香烟、癌症和统计》(Cigarettes; Cancer and Statistics)的论文,在《自然》(Nature)上发表了题为《肺癌与香烟?》(Lung Cancer and Cigarettes?)和《癌症与吸烟》(Cancer and Smoking)两篇论文。他后来把这几篇论文汇集在一起,编成了一个小册子《吸烟:关于癌症的争议及对有关证据的评论》(Smoking: the Cancer Controversy。 Some Attempts to Assess the Evidence),还加上了一个内容广博的序言。在这几篇论文中,费歇尔(照片中的他常常是叼着一只烟斗)坚持认为,吸烟会导致肺癌的证据存在着严重的不足。
当时,不单是费歇尔在研究中批评了那些有关吸烟与癌症问题的研究,梅奥诊所(Mayo Clinic)的首席统计学家、美国生物学界泰斗之一的约瑟夫?伯克森(Joseph Berkson)也对这些研究的结论提出了质疑。耶日?奈曼也提出了反对意见,认为将肺部与吸烟联系起来的研究推理当中存在问题。费歇尔的批评最为强烈。在随后的几年中,由于证据渐多,伯克森和奈曼慢慢地也似乎认可二者之间的联系被证实了,费歇尔仍然强烈地反对,甚至指责一些主要的研究者篡改了数据,使许多统计学家都感到很尴尬。那里,烟草公司认为这类研究并不能说明什么问题,指出这只不过是一种“统计相关”,并不能证明吸烟会导致肺癌。从表面上看,费歇尔似乎同意他们这一观点,费歇尔的争辩火药味很浓,例如,下面是他一篇论文中的一段话:
一年前,《英国医学会期刊》(the British Medical Association’s Journal)中登了一篇评论,得出了一个让人吃惊的结论:有必要运用当代所有的宣传手段让全世界人都详尽地了解吸烟的严重危害,这让我觉得有必要对此(那些试图证明吸烟与癌症之间关系的研究)作一个详细的分析。读这篇文章的时候,我觉得我很不喜欢“当代所有的宣传手段”这个词,而且在我看来,在这问题上应该有一个道德上的界限……为了让全世界一亿个烟民心存恐惧,而且还没说清到底该对这种舆论所反对的陋习担心些什么。,却花纳税人的钱而动用上了当代所有的宣传手段,对一个好公民来说,这实在是有点小题大做……
遗憾的是,在表示对使用政府宣传工具来传播这种恐惧的不满时,费歇尔并没有说清楚自己反对的到底是什么。这似乎印证了大家对他的看法,他就好像是那个反复无常的老头,只不过是不甘心扔掉自己那只心爱的烟斗罢了。1959年,杰尔姆?科恩菲尔德与5位来自国家癌症研究所(the National Cancer Institute;NCI)、美国癌症学会(the American Cancer Society)和斯隆-凯特林研究所(the SloanKettering Institute)的顶尖癌症专家一道,对所有已公开发表的研究作了一个回顾,撰写了一篇30页的论文。他们审查了费歇尔、伯克森和奈曼提出的反对意见,同时也探讨了烟草研究所(the Tobacco Institute,代表烟草公司的利益)的反对意见。他们由这场争论引申出阵一些更细致的推论,并且指出,有关证据压倒性地支持“吸烟是人类肺部表皮癌发生率迅速上升的原因之一”。
这篇论文平息了医学界关于这一问题的论争。尽管烟草研究所仍继续花钱在流行杂志上登整版的广告,质疑吸烟与肺癌之间的关系,认为它们仅仅是一种统计上的相关,但是在1960年以后,任何一本有名词的学术刊物上都不再有对这一发现提出质疑的文章了。该文发表之后不到4年,费歇尔便去世了,无法继续进行论战,也没有别人再掀起争议。
存在因果关系吗?
费歇尔的反对,难道仅仅是一个想安安静静地吸烟斗的老头在无理取闹呢,还是有着一定的道理?我读过他有关吸烟和癌症的论文,还将它们与他以前写的有关归纳推理(inductive reasoning)的性质、以及统计模型与科学结论之间关系的论文作了比较,发现了一条前后一致的理论脉络。费歇尔所研究的是一个艰深的哲学问题——一个由英国哲学家伯特兰?罗素(Bertrand Russell)在20世纪30年代早期就提出来了的问题,这一问题抓住了科学思想的内核,但对许多人来说也许这并不算什么问题,即究竟何为“因果关系”?这一问题的答案绝对不那么简单。
许多读者也许都记得,那个满头白发、慈父般模样的罗素是一位世界著名的哲学家,在60年代,曾经公开批评美国政府介入越战。在那之前,他就被许多官员和学者认为是20世纪伟大的哲学家之一。他的第一部主要著作,是与艾尔弗雷德?诺思?怀特海(Alfred North Whitehead,比他早入道好些年)合写的,探讨了算术与数学的哲学基础问题,书名叫《数学原理》(Principia Mathematica)。这本书试图将数学的一些基本思想,如数字与加法,建立在集合论(set theory)所用的一些简单公理上。
罗素和怀特稍顷在这本书中运用了一个基本工具,就是符号逻辑(symbolic logic),这是一种新的研究方法,是20世纪早期的一项重大创造。读者可以回忆一下学过后亚里士多德逻辑(Aristotelian logic),例如,“人都难免一死,因为苏格拉底(Socrates)是人,所以他也将难免一死。”
尽管人类对亚里士多德式逻辑规则的研究已经大约2500年了,但相对而言这是一种没有什么用的工具。它过分强调那些很明显的事实陈述,建立一些武断的逻辑规则来判断什么符合逻辑,什么不符合逻辑,却未能模仿逻辑在数学推理中的运用,这恰恰曾是人们运用逻辑创造了新知识的一个领域。当学生们还在机械地背着像“苏格拉底也会死”、“乌鸦的羽毛是黑色”之类的逻辑分类规则时,数学家们正通过运用亚里士多德逻辑范畴之外的一些逻辑方法,发现着新的思想领域,如微积分。
在19世纪末和20世纪初,随着集合论和符号逻辑的发现,一切都发生了改变。从罗素和怀特海所用的最早形式来看,符号逻辑始于一些被称为“命题”(propositions)的思想元素。每个命题都有一个称为“T”或“F ”的真值,它们还能与一些代表“和”(and)、“或”(or)、“非”(not),以及“等于”(equals)的符号相结合与对照。因为每个原子命题(atomic propositions)都有一个真值,它们的任一组合也有一个真值,这个值可以通过一系列代数步骤来计算。在这个简单的基础之上,罗素、怀特海和其他人能够建立许多符号的组合,用来描述数字和算术,似乎还能描述各类的推理过程。
在所有的推理过程中,只有一种例外!人们似乎还无法创造出一套符号,用以表示“A引致B”(A causes B)。原因和结果的概念躲过了逻辑学家所作的各努力,总是无法套进符号逻辑的规则之中。当然,我们都知道“因果关系”意味着什么,如果我将一个玻璃杯摔到浴室地板上,那这一举动将使玻璃杯破碎;如果每当狗走错方向时主人就把它拉住,那这一举动将使狗学会走正确方向;如果农场主给庄稼施肥,那这一举动将使作物生长;如果一名妇女在怀孕前3个月服用催眠药(thalidomide),那这一举动将导致所生婴儿手足萎缩;如果另有一名妇女骨盆发炎,那是因为她在子宫里放了避孕器(IUD );如果某公司的高级主管职位中女性极少,那是因为这家公司部分经理人员存在着性别歧视;如果我表兄弟脾气异常火爆,那是因为他属于狮子座的。
正如罗素在20世纪30年代早期所明确指出的,通常意义上的因果关系是一种相互矛盾的观念。不同的因果关系实例不能套用相同的推理程序,实际上,根本不存在所谓的因果关系,这只是一种流行的妄想,一个含糊的想法,它经不起纯粹理性(pure reason)的攻击。因果关系包含了一套互相矛盾的观念,在科学论述中几乎或根本没有价值。
实质蕴涵
为了取代因果概念,罗素从符号逻辑出发提出了一个清楚定义的概念,称为“实质蕴涵”(material implication)。通过使用原子命题的基本观念和一些联结符号如“和”、“或”、“非”与“等于”,我们就能产生“若命题A,则命题B”的观念,这与“非B,则非A”的命题是等价的。这听起来有点像贝叶斯定理中隐含的悖论(在第13章中我们介绍过),但还是有很大的差别,我们将在后面的一章中进行研究。
在19世纪后期,德国医师罗伯特?科赫(Robert Koch)提出了一组必要的假设,用来证明某种病原体(infective agent)将导致某种特定的疾病。这些必要假设是:
1。 只要病原体能够培养出来,疾病就会发生。
2。 只要疾病没有发生,则病原体一定没有培养出来。
3。 当病原体被消除,疾病就会消失。
虽然有点累赘,但是科赫给出了实质蕴涵的条件。在判断某种传染病是否由某种特定病菌引发时,这些条件可能是足够的。但是,对于吸烟和癌症之类的问题,科赫的必要假设就没有意义了。让我们来看看,肺癌和吸烟之间的联系在多大程度上符合科赫假设呢(从而检验了罗素的实质蕴涵是否适用)?病原体是吸烟史,疾病是肺部表皮癌。一些吸烟者并没有得肺癌,不满足科赫的第一个假设。一些得肺癌的人却声称他们没有吸过烟,若我们信其所言,则不满足科赫的第二个假设。如果我们将癌症类型限定为小细胞癌(small oatcell carcinoma),那么不吸烟却得肺癌的人数几乎为零,因而也许满足第二个假设。如果我们拿掉病原体,也就是让病人停止吸烟,他还是可能得病,因此不满足科赫的第三个假设。
如果我们应用科赫假设(从而也就是应用罗素的实质蕴涵),符合这些假设的,只有那些由血液或者其它体液培育出的特定病原体所引发的疾病。但是,对于心脏病、糖尿病、哮喘、关节炎或者其它形式的癌症,这些假设就不再适用。
科恩菲尔德的答案
让我们回过头来,看看科恩菲尔德与5位知名癌症专家在1959年发表的那篇论文,他们逐一介绍了有关吸烟与癌症关系问题所作的研究 。首先是理查德?多尔(Richard Doll)和A?布拉德福德?希尔(A。 Bradford Hill)的研究 ,发表于1952年的《英国医学期刊》(the British Medical Journal)上。多尔和希尔对英国死于肺癌人数的急剧增加感到十分吃惊,于是搜集了数百名肺癌患者,将他们与一些非肺癌患者比较,这些病人也是同时进入同一家医院的,并且在其它方面相似(相同的年龄、性别和社会经济状况)。结果发现,肺癌患者中的吸烟人数几乎是非肺癌患者(在这种研究中,常常称为“对照组”(controls))中吸烟人数的10倍。到1958年底,这类研究另外还有5项,分别以斯堪的纳维亚、美国、加拿大、法国和日本的病人为研究对象,都得到了相同的结果:肺癌患者中吸烟人数大大地高于对照组中的吸烟人数。
这类研究被称为“追溯性研究”(retrospective studies)。
从一种疾病开始着手,向后看与这种病相联的有什么先决条件。这种研究需要有对照组(未患此病的其他组病人),用以断定恰恰是这些先决条件与此病有关,而不是病人某些更一般的特征。对于这种研究,常有人批评对照组可能与所研究的病例之间不相匹配。一项著名的追溯性研究是加拿大开展的,有关人造甜味剂(artificial sweetener)是否为膀胱癌(bladder cancer)病因的研究。结果表明,人造甜味剂与膀胱癌之间似乎存在着某种关联,但是通过对数据的仔细分析之后,发现这些病例几乎都来自社会经济地位较低的阶层,而对照组几乎都来自社会经济地位较高阶层。这意味着研究组与对照组之间不具有可比性。20世纪90年代初期,耶鲁大学医学院(the Yale Medical School)的阿尔万?范斯坦(Alvan Feinstein)和拉尔夫?霍维茨(Ralph Horvitz)对如何进行这类研究提出了一些非常严格的规则,以确保研究组和对照组相互匹配。如果我们将范斯坦-霍维茨 规则(FeinsteinHorvitz rules)应用到这些针对癌症和吸烟关系的追溯性病例对照(casecontrol)研究之上,那么所有这些研究都不符合规则。
另一种替代的研究方法是事前研究(prospective study)。在这类研究中,事先选定一群人,详细记录他们的吸烟史,再跟踪他们以观察会发生些什么事。到1958年,已单独地进行了三次事前研究,第一次研究(同样是希尔和多尔所作,他们开展了第一个追溯性研究)选取了50 000名英国医生。实际上,希尔和多尔这项研究中并未对研究对象跟踪很长时间,而只是通过面谈了解了这50 000名医生的健康习惯,包括他们的吸烟习惯,跟踪调查5年之后,其中很多人真地患上了肺癌。这一研究确实说明吸烟与癌症之间存在联系。他们依据吸烟量的大小将这些医生分成了不同组,结果表明,吸烟越多的医生得肺癌的概率越大。这就是所谓的剂量反应(dose response),是药理学中产生反应的关键证据。在美国,哈蒙德(Hammond)和堆恩(Horn)对187 783名男子进行了一次前事研究(发表于1958年),他们跟踪调查了4个月,也发现了剂量反应。
然而,事前研究还存在一些问题。如果研究是小范围的,结论也许只是针对某个特定群体而言的,不能将它推广到更广泛的人群当中。例如,早期大部分的事前研究都以男性为研究对象,因为当时女性肺癌病例过少,无法开展研究。事前研究的第二个问题是,为了让事件(肺癌)发生得足够多,允许作有意义的分析,研究持续的时间必须很长。解决这两个问