您有没有碰到过这样的问题,文章在投稿后,评审专家让您提供effect size(效应量)。相信大多数临床医生的表情都是下面这样的。
“笑音量?你说笑……笑啥?!”
无论是我们在进行一个相关性分析时,还是比较组间某一个指标绝对值高低、发生率高低的差异时,我们都习惯了上来就报告p值和统计量。其实这个时候我们已经忽略了一个重要的内容:我们关注了是否存在【效应】(效应是否有统计学意义),但存在的效应真的【有价值】?真的足够【有临床意义】么?
因此,当我们转换身份成为一个读者的时候,我们除了知道【有没有差别】,还一定想知道【到底差多少】。而后面这个差多少,其实就是效应量。因此我们不难理解,所谓的效应量(也就是效应大小),其实对应着一个真实的差异或者关联,效应量就是这种真实差异或关联的强度。
比如在这个图中,a、b两个情况下,都有统计学差异。但是到底a的效应更有实际意义,还是b的效应更有实际意义呢?显然是b,也就是b的效应量更大。
也许你觉得好像得到了什么?但是也好像什么也没得到。对了,这感觉就是效应量,效应量就是一个这么抽象的东西。效应量不是一个单一的指标,而是一种真实的差异,这种差异需要通过一些指标(能够反应效应量的指标)来体现。让我们来举个例子:
我们想知道吃不吃维生素对孩子身高的影响。这里面因素是吃/不吃维生素,效应是组间身高的差别。这里面效应量是什么呢?一定是能够反应身高差别的指标啦!但是身高差别都需要什么指标来评价呢?真的只有比较均数么?到底都有哪些指标可以反应组间身高的差别呢?
1、身高均值之差:反应组间集中趋势的差异,最简单粗暴的指标,在实际情况下,身高通常符合正态分布,因此均值之差也是我们衡量的首选效应量。
2、身高变异系数之差:变异系数cv反应的是身高的变异,说白了就是看我们这一组孩子是不是高的高矮的矮。变异系数越小,说明大家的身高差不多。维生素到底是不是会影响到身高的变异情况呢?这个还真没准儿。
3、身高离群值下限之差:反应的是到底是哪一组矮的更厉害。其实补充维生素这类的物质,未必对全人群有效啊,不缺维生素的孩子,多不了可能并不会长得更高。而对于那些却维生素的孩子,补了效果更明显。所以嘛,谁知道到底是不是真正的效应在矮个子里面?
……
虽然这里只是粗暴的打了个比方(各位统计学大拿请随意打脸)。不过,看到这里您一定会明白了,所谓的效应量并不是一个唯一的参数,而且有时候在我们做研究之前也未必完全想清楚了(当然我们希望大家先想清楚)。所谓的效应量,可以理解为真实存在的某种差异,而我们是通过找到合适的效应量评价指标,来说明真实的效应到底有多大。上面的指标只是给大家看看玩儿的,当然对于医学研究,绝大多数的研究中的效应量就是真实的差值(均数差),或者是rr、or、hr、相关系数、r²……等等。对于一些比较抽象的指标,我们可能无法直观的比较均数差,比如量表的结果。对于这类指标,不同量表可能差值没法直接比较,因此我们就需要得到一些去掉工具影响的大小,这时就需要一些特定的效应量指标来帮助我们了。常见的指标有以下这些。
计算方法可以参考如下的公式:
参考文献:
1. 卢谢峰, 唐源鸿, 曾凡梅. 效应量:估计、报告和解释[j]. 心理学探新, 2011, 31(3):260-264.
2. 郑昊敏, 温忠麟, 吴艳. 心理学常用效应量的选用与分析[j].心理科学进展, 2011, 19(12):1868-1878.