病例对照研究是指:研究开始时选择一组发生结局的人(病例)和另一组未发生结局的样本人群(对照);然后比较两组的预测变量水平以探索哪些预测变量与结局发生存在关联。比如下图,右上有“x”的是病例,右下是对照;左边分别是回溯的病例与对照过去某一时点的状态,当然他们那时大概都还不是所谓的“病例”;在左边的人中,黄色代表预测变量指示“异常”(通常是阴性,即‘0’),白色代表预测变量指示“正常”(阳性,或‘1’)。
病例-对照研究设计是因果推断强度较弱的一种研究设计,在设计与实施过程中发生偏倚的风险较高。病例-对照研究的偏倚主要有两个来源:即回顾性测量偏倚和选择偏倚。其中,控制选择偏倚是病例-对照研究设计时的难点。病例组和对照组是分别从患病群体与非患病群体中进行抽样获得的,但病例的选择常常受限于可获得研究对象的来源,而不可能有很好的代表性。比如,我们选取病例的时候通常会基于大型医院门诊就医的患者,而社区医院就诊、未就诊的患者很可能会与已纳入的患者存在差异。在此情况下,选择合理的对照是至关重要的(比如同样从大型医院的门诊获取)。
但实际情况是,针对同一研究问题开展的多项病例-对照研究往往会采用不同的对照选择策略(比如有的研究选择了门诊非该病患者、有的选择了特定社区健康人、有的选择了健康志愿者……),导致采用了不同对照类型的各个研究之间结果相互矛盾,这就带来了研究之间系统性的差异,即所谓的异质性。那么,既然不同研究间,病例与对照的可比性不同(研究间的混杂因素不同),是否可以在每个研究中通过统计学调整来控制混杂因素,从而使每个研究得到的调整后效应更为相似呢?如果真的可以的话,我们使用调整后的效应(很多时候是得到的or值),就有可能增强纳入meta-分析的独立研究之间的同质性了。这是个复杂的问题,单纯通过推到似乎很难得到便于理解的结论。我们不妨通过一个具体的案例来探讨一下,也许能发现背后的规律。
针对“被动吸烟是否会增加女性乳腺癌发病风险?”这个问题,限定在“对病例-对照研究进行的”这一范围内。我们能够检索到10篇已发表的病例-对照研究meta-分析,共纳入75项原始研究。这10篇meta-分析中有1篇采用了原始or值(四格表数据计算的or值,没有经过多因素回归或是匹配进行调整)进行合并,3篇采用了调整混杂因素后的or值进行合并,其余6篇则既包含原始or值,又包含调整混杂因素后的or值(表1)。
表1,10篇meta-分析的基本特征
在这10个用到的75个原始研究中,有64个是回顾性的病例-对照研究;其中能够根据文章中报到的结果,同时推算出原始or和调整后or的研究一共有27个。我们就用这27个研究的数据进行了原始or和调整后or的比较,并且计算了每个研究的rd(relative deviation)。rd=丨(调整后or-原始or)/原始or丨,rd反应的是调整(控制混杂因素)对or值带来的影响到底有多大。在27个原始病例-对照研究中,每项原始研究调整的变量及变量个数均不相同(混杂因素控制策略不同)。这些控制策略的差异,是否会带来or值调整力度的差别呢?下面中,每一行是一个研究,左边是每个研究控制了几个混杂因素,右边是每个研究的rd(调整给or带来了多大影响)。看起来rd与控制因素的多少之间似乎没什么关系,这意味着单纯从控制因素的多少,很难判断某个研究调整后的or是否更可靠。因此,单从控制因素的多少,似乎很难评价研究间的异质性的问题是否得到了解决。
图1 各原始病例-对照研究的混杂因素调整个数及其相应的调整后or值与原始or值的偏差
既然这样,我们不妨拿出汇总后的or,把它当做一个标记(下图中分别用虚线给出了汇总后or值的上限和下限)。如果混杂因素控制的越多,真的代表我们得到的or值更接近某一个真实水平的话,我们应该在图中看到一个“收敛”的趋势。即某个研究的调整后or控制因素越多(纳入了更多的因素),这个研究的调整后or就更容易落在汇总or值上下限之间的位置(靠近上下限间的中心线)。但是当我们画出下图后(每个点代表一个研究,纵坐标是该研究调整后or的水平,横坐标是得到该调整后or时到底控制了几个因素),不难看出:不理会个别偏离很大的研究,大多数研究似乎并没有呈现出“控制因素越多,调整后or约接近汇总后or”的趋势。换个高大上的说法就是:调整or值未随着调整混杂因素的个数增加而趋于收敛(图2)。这个现象提示,原始病例-对照研究之间可能存在导致异质性的其他因素。如果原始研究缺乏方法学(设计与实施)的同质性,分析阶段的统计调整很难消除潜在混杂偏倚。而混杂因素调整策略的异质性可能在病例-对照研究的meta-分析中引入新的偏倚,影响合并效应值的准确性。
图2 调整or值与调整混杂因素个数之间的关系
总之,这一系列结果提醒我们根据病例-对照研究的meta-分析结果进行决策时应审慎考虑病例-对照研究本身存在的偏倚风险,对缺少方法学同质性的病例-对照研究的meta-分析结果应审慎解读。
友情提示:本文源于彭晓霞老师团队研究结果,由小编们基于彭老师给出的文章主线进行了解读和调整。如需详细信息请参考原文。如本文的解读存在偏差,以彭晓霞老师及其团队成员的最终解释为准。
下一篇:风险因素的识别和结局的预测大不同