我在审稿中“枪毙”了不少稿件,主要原因是研究工作的科学性不符合要求,入选文献中的数据同质性不好,不能满足合并数据分析的基本要求,稿件不宜刊用。
是什么?是合并分析,是将多篇类似研究的数据用统计学方法合并,通过扩大得出明确结论,其统计学基础是数据的同质性。
我们上小学1年级时学过1 1=2,是真理;上大学统计课时学过计算均数,是1 1=2的翻版。我的统计老师李天霖教授问我一个问题:“一个人 一条狗=?”。显然我们忽视了数学计算的科学基础,无论做加减法还是计算均数,我们的潜意识里默认计算的数据具有同质性!数字是抽象的,冷冰冰的;现实世界是丰富的,充实的,看得见摸得着的。在应用数学工具时,数字背后的含义往往被我们忽视,是经常出现同质性错误的原因。
中数据同质性涉及多个维度:如方案是否相同,研究对象是否相似,干预措施是否相同或相似,终点结局的测量评价及其时间是否相同或相似等。没有人会反对这些要求,但在实践中经常出问题。举几个例子。1)研究方案的同质性。观察性研究的可以入选队列研究、病例-对照研究横断面研究等类型的文献,但将这些不同研究方案的文献数据合并做合理吗?队列研究由因到果,病例-对照研究由果到因,横断面研究只能做相关性分析,研究方案的设计思路不同,研究对象入选和分组形成的途径及机制不同,研究方案的适用范围不同,研究方案使用的主要统计学评价指标和数学模型不同……。研究方案与生俱来的影响数据同质性的特征决定了不同类型研究方案的数据不具备合并分析的同质性。在这种情况下,强行将不同类型研究方案所得的数据合并做在数学上可行,在科学上不合理。2)干预措施同质性。社区干预对糖尿病患者血糖控制水平的影响,看上去是一个很好的选题,入选了许多社区干预的文献,而且都是随机对照研究。但我们想一想,不同文献中的社区干预一样吗?不一样!每篇论文中的社区干预都是独特的,与其它研究不同的。糟糕的是,文献中的社区干预缺少必要的介绍,究竟怎么做的没有写清楚,无法搞清楚这篇论文中的社区干预与那篇论文中的社区干预在哪些方面相同,哪些方面不同。在这种情况下,默认社区干预措施具有同质性,进而做得出结论合适吗?试问,结果用于临床实践如何操作?你知道应该使用什么样的社区干预改进我们的临床实践吗?不知道!这样的论文是有益还是有害?能发表吗?3)对照的同质性。入选rct文献做没有问题,但有些文献的对照组采用安慰剂或干脆不给干预,有些文献的对照组采用临床常规治疗,分析时将安慰剂与临床常规治疗合并行吗?将阴性对照和阳性对照数据合并不合理,两者没有同质性基础。
举了三个例子说明中数据同质性问题。其共性特点是,鉴别数据是否具备同质性基础要求做的人应具有相应的专业知识和对实际情况全面深入的了解;应具备分析和评估能力,能够客观地评估拟的问题是采用常规方法更合理,还是选择方法更好;有勇气说这样做不合理。建议准备做的朋友先收集一点资料,对文献中的数据同质性进行评估,在确认了数据确实具有一定的同质性,能够满足要求后再动手,规避论文无法刊用的风险。
下一篇:如何填写随机信封编制的基本信息表