不少医生朋友写英文文章的时候,喜欢参照一个或多个其他类似研究,以他们作为模板撰写。尤其是涉及材料与方法的部分,如果大致相似,经常会一股脑借鉴过来。殊不知一些看起来相似的说法,其实真是的含义却截然不同。比如我们最常用的置信区间就是如此。说到置信区间,他的缩写ci大家一定是再熟悉不过了。所谓的置信区间,我们经常会理解为对所估计数值的一个描述,我们认为点估计可能不一定会准确,因此给出一个区间来代表我们的不确定性。
然而当中文基本上都是这个含义,且英文也都是ci这一缩写时,却存在两种计算方法和哲学思想完全不同的英文全称:confidence interval和credible interval。熟悉统计学方法的老师可能已经感受到他们气场的差异了。前者是我们学习统计学过程中经常见到的ci,而后者则是既高大上又越来越常见的另一种ci——贝叶斯学派的“置信区间”。
提到两种ci的差别,还真难以一言半语说清楚,至少要回溯到两大学派的思想差异和理论差异上去:
1、形象但是不严谨的解释是,频率学派有点像哲学上的“理性主义”,认为我们不知道的事物,背后总会有个真实的客观规律。频率学派(不用想了,您学过的知识基本上都是频率学派的)认为每个我们想知道的参数(比如总体均数、某一回归的系数)是一个特定的“真实数值”,但是我们每一个研究仅仅是对一个有限的样本(来自总体的抽样)进行的,得到的结论并不是“真实数值”。假如我们能够重复100次这样的研究,我们每次结论应该都在真实值附近,那么这100次研究去掉头尾的极端情况,中间的区间很可能是将来再次重复研究时,我们会得到的结果。因此这一区域就是我们的ci。当然我们认为真实值很可能也在里面,但这仅仅是个推断。这也许是为什么频率学派使用了confidence这个词,毕竟我们不知道真实情况,我们只是“相信”真实值在这个区间内(这仅仅是小编单纯的猜测)。
2、同样形象但不严谨的解释是,贝叶斯学派有点像哲学上的“经验主义”,认为我们不应该被未知的事物主导,而应该关注自己得到的信息。比如我们真真切切看到的是某一次研究的结果,而从结果出发看待“真实数值”的时候,不确定的并不是我们的结果,而是所谓的“真实数值”,只有通过对结果的不断完善,才能得到“真实数值”更为准确的估计。粗看起来可能差不多,实际从哲学层面还是相差不少的,如果熟悉哲学发展的历程,您一定听说过当年以笛卡尔和莱布尼茨为代表的“理性主义”思想,大战以洛克和牛顿为代表的“经验主义”思想的史诗争论。与更像“理性主义”的频率学派不同,“经验主义”的贝叶斯学派认为:在所谓的“真实”真正解开面纱之前,其本身就存在不确定性。因此我们基于各种新的、旧的信息所得到的结论,都是我们对所谓“真实”的认识,而我们能确信的也只有这种认识。换句话说,“真理存在与我们真真切切的认识中”。因此对于credible这个说法,贝叶斯们认为自己才用得起。
当然扯了半天,简单回归一句话:我们用confidence interval还是credible interval,完全取决于我们研究设计、分析的时候用的是那一套统计学理论。当我们用的是传统的频率学派时(绝大倒数情况)我们用的其实是confidence interval;当我们用的是贝叶斯学派的算法是(别问什么时候,因为太高大上,用到的话你一定会知道)才能使用credible interval。
下一篇: