在前一期文章中我们看了t检验中p值的决定因素和诊断指标的诊断价值的决定因素,两者差别在于,即均值和标准差保持不变时,增加时p值变小,但本身不会影响诊断指标的诊断价值。在大样本的中,如果某指标差异有统计学意义,并不代表其有较好的预测能力。
什么算是大样本呢?我们先来模拟一组数据,我们固定均值差为4和标准差为2(此时灵敏度和特异度在85%左右),减少,观察p值、灵敏度和特异度的变化,我们可以得到下表:
从上表看出,当为1000时,此时p值小于10-308方,当减少,p值增大,灵敏度和特异度基本不变(由于抽样误差的原因,灵敏度和特异度有波动)。为10时,p还是小于0.001,每组为3时,p<0.05。也即是说预测能力较好的指标在很小时就有统计学差异了。
接着我们再固定p接近0.05,标准差为2,不同下计算指标灵敏度、特异度和下面积。
从上表可以看到指标的诊断价值随增加而减少,当增加到50,p=0.049时,auc=0.598,诊断价值已经非常小。也即是说如果你的有几十个还未出现统计学差异,此指标单独进行预测的能力已经不太好。看到这个结果你是不是很震惊,你还会随意拿指标去做预测吗?
通过上面的数据,我们总结一下,就是在筛选诊断指标时,想看某指标是否有预诊断价值,只需要较小的有代表性的样本就可以了,建议每组的在10-30之间,如果大于30还未出现统计学差异,这个指标就可以放弃了;但在做某指标的诊断价值的验证时,为保证诊断模型的稳定,可不能太小,一般认为100-200例以上可以接受。
上一篇:
下一篇: