一、一起来yy
小明发现最新的文献中提出了一个新的指标“神奇标记物”(x marker,xm),通过定量测量xm,有可能能够帮助诊断疾病“x”(x disease,xd)。对于这种定量指标,当我们试图评价它对区分某一疾病或是预后状态的能力时,往往会使用诊断性研究中常用的统计学方法——,并计算曲线下面积auc。
小明手头刚好收集了一批临床患者和他们的生物样本。其中总共收集了待诊断是否有xd的患者500例,都保留了生物样本,可供定量测量xm水平。500例患者中,最终通过随访确诊为xd的患者总共有50例。
二、问题来啦!
小明想通过绘制来评价xm对xd的诊断价值,下面哪种做法更可取呢:
1、小明必须把这500例患者的生物样本都拿来测一遍,这样才能保证是正确的,有价值的。如果破坏了真阳性率,就有可能导致估计系统性的偏离原始位置,auc也不可靠了。对么?
2、把500例生物样本都做了实在太浪费,我们完全可以挑出确诊xd的50例真阳性患者,再从450例肯定没有xd的真阴险患者中随机抽取50例出来。这样只用对100例样本测量xm的水平并且绘制就行了。对么?
三、不看公式看结果
如果您是统计学大拿,或者以前诊断试验相关的知识足够扎实,想必已经在心中得出结论了。如果还没有得出结论,那就先跟着我们看一组模拟数据的结果,相信无需进行公式推导您也能大致了解一二了。
让我们模拟一下,保留全部确诊xd的50例真阳性患者,同时逐渐减少真阴性患者的数量,看看和auc到底会产生什么变化。
先来看看几个的形状:
看图明显差不多啊!真阴性无论是保留原始的450例,还是逐渐进行随机抽样到最后仅剩25例,画出来的似乎都是一个模样的!所以如果从曲线上找分界点的话,当然也不会差十万八千里啊。
我们当然看到了他们有相似的曲线下面积(auc),但是到底有多相似呢?让我们来看看汇总的结果。
我们看看,好像无论是否对真阴性的患者进行抽样,以及抽样比例如何,auc的点估计值都非常相近。换句话说,是否保留原始的真阳性、真阴性患者比例,并不太影响auc的准确性。受影响的只有auc估计的精度,也就是标准误(se)和95%可信区间的宽度。
因此,即便是一个破坏了原始比例的横断面研究,或是在真实待诊断人群中随机、不等比例的抽取了部分真阴性、真阳性的患者。和auc都还是可靠的。总之一句话,如果要用评价某一连续指标的诊断价值时,未必非得测量所有的待诊断人群才行。分别抽取一部分阳性、一部分阴性的患者,得到的结论也是对的。对于上面的两个问题,当然我个人还是倾向于选择2的。不过有时候如果真阳性率不算太高或太低,而且指标的测量不会成本太高,还是鼓励都测测的,毕竟对auc的估计精度还是有些贡献的。
至于原理嘛,其实很简单。的本质是对特异度和灵敏度的连续计算和展示,而特异度和灵敏度对真阴性和真阳性的构成比并没有什么特殊要求,无论怎么调整都不会发生变化。
上一篇:在一张白纸上写知情同意书太难了
下一篇:sci论文里的那些流程图