女士品茶:统计学如何变革了科学和生活
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

概率单位分析

根据费希尔的思想,布利斯很快开始设计实验,将昆虫分成不同小组,放在玻璃瓶中,设置不同的条件组合,施用不同剂量的杀虫剂。他进行这些实验时,开始注意到一个有趣的现象:不管杀虫剂的浓度有多高,总是有一两只昆虫能活下来。不管杀虫剂的浓度有多低,即使只用溶液,也会有几只昆虫被杀死。

面对这种明显的变动性,我们也许应该根据皮尔逊统计分布对杀虫剂的影响建立模型。问题是如何建立模型?读者可以回想起高中代数课上做应用题的可怕经历。甲先生和乙先生在静水或稳定的水流中划船,或者将水和油混合在一起,要么是来回抛球。这些应用题会给出一些数字,再提出一个问题,可怜的学生需要根据题意列出方程,解出x。读者可能还记得当时自己努力把教科书往前翻,拼命寻找已经得到解答的类似问题,努力将新的数据套到已有方程里的情景。

在高中代数课上,已经有人事先列出了方程式。老师即使不知道这些方程式,也可以在教师教学手册上找到它们。假设有这么一道应用题,没有人知道如何列出方程式,有些信息是多余的,对解题毫无帮助,有些重要信息又没有出现在题目中,之前的教材中也没有类似的例子。这就是一个人想要用统计模型解决现实生活问题时遇到的情景,也是布利斯想要把新的概率分布数学思想应用到杀虫剂实验时面临的情况。

布利斯发明了一个程序,他称之为“概率单位分析”。他的发明在很大程度上用到了自己的原创性思想。费希尔、“学生”和其他人的作品并不能告诉他应该如何前进。布利斯之所以使用“概率单位”这个词,是因为他的模型能够将杀虫剂的剂量与一只昆虫在这个剂量下死亡的概率联系起来。在他的模型中,最重要的参数叫做“50%致死剂量”,通常被称为“LD-50”。这种剂量的杀虫剂有50%的概率杀死昆虫。如果这种杀虫剂用在大量昆虫身上,那么50%的昆虫会被杀死。另外,布利斯的模型无法确定杀死某只昆虫所需要的剂量。

布利斯的概率单位分析已经成功应用到了毒理学问题中。从某种意义上说,源自概率单位分析的深层思想构成了毒理学的主要基础。概率单位分析为16世纪内科医生帕拉塞尔苏斯(Paracelsus)首先确立的学说提供了数学基础。帕拉塞尔苏斯认为“药剂本身不是毒药”,他认为如果浓度足够高,所有的东西都可能具有毒性;如果浓度足够低,所有的东西都是无毒的。在这个基础上,布利斯加入了与个体结果相关的不确定性。

许多可卡因、海洛因或冰毒等街头毒品的使用者之所以死亡或者身体虚弱,是因为他们看到其他服用毒品的人活得好好的。他们就像布利斯的昆虫一样,环顾四周,发现其他一些“昆虫”仍然活着。不过,其他一些个体仍然存活的事实并不能保证某个个体不会死掉。我们无法预测单个个体的反应。和皮尔逊统计模型中的个体观测值一样,这些个体的反应并不是科学研究的“对象”。我们只能估计抽象的概率分布及其参数(如50%致死剂量)。

布利斯提出概率单位分析之后,其他研究人员跟着提出了不同的数学分布。现代计算机程序在计算50%致死剂量时通常让用户从几个模型中选择一个,这些模型都是对布利斯模型的改进。研究显示,在使用实际数据时,所有这些方法可以得到非常相似的50%致死剂量估计值,不过它们在10%致死剂量等低概率剂量的估计上存在差异。

我们可以用概率单位分析替代任何模型估计某种致死剂量,如LD-25或LD-80,即具有25%或80%致死率的剂量。要想得到良好的估计值,你离50%的位置越远,你需要做的实验就越多。我曾经参加过一项研究,目标是确定某种化合物对老鼠的1%致癌剂量。实验使用了65 000只老鼠,不过根据我们对最终结果的分析,我们仍然没有获得1%致癌剂量的良好估计值。根据实验数据来计算,要想获得可以接受的1%致癌剂量估计值,我们需要几亿只老鼠。