不论大小,做一篇有思想的报告。我们在经历了焦头烂额的数据采集、录入和清洗之后,瞬间我们又面临另外一个问题,就是面对着复杂的数据库该如何下手呢?有的人说应该按照别人的文章把自己的数据算一遍,的确前车可鉴,但是绝不可“人云亦云”;也有的人说把所有采集的变量“挨个放血”,然后“流水账式”的展示结果。
这些肯定都不行,我们觉得不论研究大小,文章写出来都要有思想、有逻辑、有主见。这就要求我们在时心中长存“分析主线”,科技文献的写作要井然有序、有理有据,所以一篇文章的结果部分一定要有着完善的逻辑推导过程,推理严密、不遗漏任何可能的情况。
所以在之前我们需要思考以下三个问题:(1)我最终想证实什么问题?(2)我如何才能证实这个问题?(3)会有哪些因素影响这个问题,我的证实过程是否严密?如果都想清楚了,就可以开始写方案了,或者在纸上简单地画出分析流程。
接下来我们就要开始分析数据库,我们知道在数据里往往都存在有这样四类变量:研究对象的一般资料、主要研究指标、次要研究指标、其他可能相关的指标。对主要和次要研究指标的分析是我们得出研究结论的主线,而对研究对象的一般资料和其他可能相关的指标的分析是用来完善和支持研究结论的,使得主要结论得出的严密和合理。
是一个由简单到复杂的过程,常规是由简单粗暴的分析----稍微细致的分析----全面严密的分析。也许最终我们也实现不了全面严密的分析,因为有某些影响因素在研究设计之初我们就没有收集,这也没关系在讨论时我们解释就行,也给后续的研究作出提示。
细说分析过程如下:首先,我们应该看两个指标之间简单的、粗犷的关系;然后我们再考虑这种关系会不会受到其他因素的影响。如果影响的因素少,我们可以考虑按此因素分层去分析。如果影响因素多,这种分层会特别复杂,比如按照4个年龄组和3种疾病的严重程度去分层,我们就需要分4*3=12层,这样一来每层的研究对象数量就有可能会很少,这时候我们可以考虑采用多因素回归的方法去分析问题。同时回归分析还可以用来探索因素与因素之间的交互作用。
除了上述的理清分析思路外,操作是否可以交给别人来做呢?我们觉得分析过程最好是由研究者自己操刀,或者研究者和人员一起做,边做边聊。因为是需要尝试的,尤其是多因素分析,我们只有在尝试了多种分析方法之后才能从中选出最合理的分析结果,才能对数据有着最为全面和真实的认识。除此之外,方案也不是一成不变的,很可能我们就需要根据上一步的统计结果去调整接下来的分析思路。
上一篇:临床研究中如何防止向均数回归?