队列研究是我们常用的一类研究方案,在研究中暴露在前、结局在后,未发生某一结局(未患病)的研究对象因为是否存在暴露(某潜在危险因素)被自然分成两组,经过一段时间的随访观察结局(是否患病)出现的情况。由于队列研究这种从“因”到“果”的特点,其在建立因果关系、并合理估计暴露因素的效应过程中至关重要。
队列研究中,最常见的模式是这样的:
rr: 暴露人群与非暴露人群患病概率之比
在良好的队列研究中,我们能够直接得到暴露与分暴露人群最终的患病率,因此在队列研究中,我们常使用rr值来估计暴露因素对患病风险增加的实际效应。 说起来,其实使用rr值还有个非常重要的前提条件,就是我们能准确计算暴露组的患病率p和非暴露组的患病率。那么问题来了,队列研究都能计算出这两个值,进而得到rr值么?对此不同的专家都曾在论著中发表过意见,让我们一起看看。(由于意见不一致,在此我们不一一指出出处了,真感兴趣的话,可以私下讨论~)
观点1:回顾性队列研究不能计算rr值?
有专家在著作中提出,是否为“回顾性队列”是判断能否使用rr值评价暴露效应的条件。的确,在前瞻性队列研究中,我们能更完善的记录患者的信息,研究对象的观察起点、终点也很明确,得到准确的p和并不困难。但是在回顾性队列中,则可能出现一些情况导致我们对两个概率的估计出现偏差。但是也并非所有的回顾性队列都无法准确计算这两个概率,比如基于某医院的孕妇产检队列完成的研究,各项信息和最终生产结局记录完整,当然可以准确计算两个概率和rr值。
观点2:基于医院患者建立的队列不能计算rr值?
基于社区人群的队列,其人群代表性比较可靠。而基于医院的队列并不能完整的代表社区人群,毕竟其中非健康状态人群比例较大。此时用医院队列得到的某危险因素rr值来估计该因素的实际效应,就有可能存在错误估计。但是如果我们的外推仅仅是对医院的患者呢?当我们仅外推到医院这个大人群时,并不存在无法计算rr值的问题。
观点3:当潜在偏倚存在的可能性较大时,队列研究的rr值可能存在偏差!
其实从上两个观点各有道理,却又都有局限性。但是他们背后的规律都是潜在偏倚导致了对效应的错误估计。基于回顾性队列计算rr值时,其rr值可能受到信息偏倚(比如失访不均)的影响而发生偏离;基于医院人群的队列计算rr值时,其rr值可能受到选择偏倚的影响而发生偏离。总之,偏倚本身的效应就是导致我们对危险因素效应的估计存在偏差,当然也会影响到rr值本身。
rr是如何受到影响的呢?
我们不妨来个糖炒栗子。假设我们有一个队列研究,研究开始选取没有发生结局的暴露组100人,非暴露组100人。
理想情况下,患者不会出现失访,随访1年后两组患者的患病率相同,均为50%。此时的真实rr值应该等于1。
实际上失访是不可避免的,随访一段时间后一些患者陆续失访了,两组仍能随访到的人数分别为75人(暴露组)和60人(非暴露组)。
同时,暴露组与非暴露组中,失访对象中患病率并不相同。比如观察新药a和传统药物b的不良反应,因为a刚上市,因而医生和患者都更关注其不良反隐,因此以一旦出现不良反应的倾向都会及时随访并记录;失访的患者通常没有什么大问题。而老药b上市很多年了,即便出现了不良反应患者和医生也都习以为常了,甚至患者出现不良反应后认为医生水平不高,反而更倾向于失访。就形成了这样的尴尬局面。
此时估计的rr值已经不再是真实的1了,到底偏了多远呢?让我们来算算看。
可见,潜在的偏倚会直接影响效应的估计。因此在计算rr值之前,我们首先还是要估计一下偏倚的种类、方向和水平,从而为我们估计真实效应奠定基础。当然rr值还是可以算的,但是rr值是否是真实的rr值,还要看p和p-的估计是否准确。
上一篇:论文写作中的“统计分析”部分
下一篇:临床研究中的常见偏倚——病例错分