用挑选出的“病例”和“非病例”算出的roc曲线可靠么？ -凯发k8国际首页登录

时间：2018-08-19 阅: 1543 关注

标签: 统计方法 roc曲线

　　一、一起来yy

　　小明发现最新的文献中提出了一个新的指标“神奇标记物”(x marker，xm)，通过定量测量xm，有可能能够帮助诊断疾病“x”(x disease，xd)。对于这种定量指标，当我们试图评价它对区分某一疾病或是预后状态的能力时，往往会使用诊断性研究中常用的统计学方法——，并计算曲线下面积auc。

　　小明手头刚好收集了一批临床患者和他们的生物样本。其中总共收集了待诊断是否有xd的患者500例，都保留了生物样本，可供定量测量xm水平。500例患者中，最终通过随访确诊为xd的患者总共有50例。

　　二、问题来啦!

　　小明想通过绘制来评价xm对xd的诊断价值，下面哪种做法更可取呢：

　　1、小明必须把这500例患者的生物样本都拿来测一遍，这样才能保证是正确的，有价值的。如果破坏了真阳性率，就有可能导致估计系统性的偏离原始位置，auc也不可靠了。对么?

　　2、把500例生物样本都做了实在太浪费，我们完全可以挑出确诊xd的50例真阳性患者，再从450例肯定没有xd的真阴险患者中随机抽取50例出来。这样只用对100例样本测量xm的水平并且绘制就行了。对么?

　　三、不看公式看结果

　　如果您是统计学大拿，或者以前诊断试验相关的知识足够扎实，想必已经在心中得出结论了。如果还没有得出结论，那就先跟着我们看一组模拟数据的结果，相信无需进行公式推导您也能大致了解一二了。

　　让我们模拟一下，保留全部确诊xd的50例真阳性患者，同时逐渐减少真阴性患者的数量，看看和auc到底会产生什么变化。

　　先来看看几个的形状：

　　看图明显差不多啊!真阴性无论是保留原始的450例，还是逐渐进行随机抽样到最后仅剩25例，画出来的似乎都是一个模样的!所以如果从曲线上找分界点的话，当然也不会差十万八千里啊。

　　我们当然看到了他们有相似的曲线下面积(auc)，但是到底有多相似呢?让我们来看看汇总的结果。

　　我们看看，好像无论是否对真阴性的患者进行抽样，以及抽样比例如何，auc的点估计值都非常相近。换句话说，是否保留原始的真阳性、真阴性患者比例，并不太影响auc的准确性。受影响的只有auc估计的精度，也就是标准误(se)和95%可信区间的宽度。

　　因此，即便是一个破坏了原始比例的横断面研究，或是在真实待诊断人群中随机、不等比例的抽取了部分真阴性、真阳性的患者。和auc都还是可靠的。总之一句话，如果要用评价某一连续指标的诊断价值时，未必非得测量所有的待诊断人群才行。分别抽取一部分阳性、一部分阴性的患者，得到的结论也是对的。对于上面的两个问题，当然我个人还是倾向于选择2的。不过有时候如果真阳性率不算太高或太低，而且指标的测量不会成本太高，还是鼓励都测测的，毕竟对auc的估计精度还是有些贡献的。

　　至于原理嘛，其实很简单。的本质是对特异度和灵敏度的连续计算和展示，而特异度和灵敏度对真阴性和真阳性的构成比并没有什么特殊要求，无论怎么调整都不会发生变化。