正文

spss:分类资料(r×c列联表)统计分析方法选择 -凯发k8国际首页登录

  :分类数据(r×c列联表)方法选择。分类资料在医学统计中很常见,比如(有效、无效),(发病、不发病),(男、女)等等。分类资料一般根据频数整理成列联表的形式,一般的列联表多是二维的(也称行列表,或rc列联表,高维列联表下次讨论),列联表根据变量是否有序可以分为双向无序、单项有序、双向有序列联表,统计方法是不同的,分析如下:

  一、双向无序列联表

  是指行、列变量均为无序的列联表,例如要研究吸烟和肺癌之间的关系,行变量为是否吸烟:吸烟、不吸烟,列变量为肺癌发病:发病,不发病,如下表:

  对于这种数据,我们的统计目的是分析行列变量的独立性,即:肺癌发病是否与吸烟有关,可选用的方法有以下两种:

  1、pearson卡方检验

  基于卡方分布,h0为行、列变量相互独立,中“分析->描述性统计->交叉表”可实现。使用条件:①样本总数大于40;②各个单元格理论值均大于5。

  2、fisher精确概率

  基于超几何分布,当数据不满足pearson卡方检验时使用。中“分析->描述性统计->交叉表”可实现。注意仅提供了2×2表的精确概率,需要计算r×c列联表的精确概率需要自己编程实现。

  二、单项有序的列联表

  常见的情况是结果变量有序,而原因变量无序。比如要比较ab两种药物的治疗效果,药物分组(ab)是无序的,而结果变量是有序的(无效,显效,治愈),可以整理成如下的表格:

  可以选择的统计方法主要有:

  1、mann–whitney u检验(也叫mann–whitney–wilcoxon检验、wilcoxon rank-sum检验,wilcoxon–mann–whitney检验):

  基于卡方分布,h0为两组总体分布一致,中“分析->非参数检验->独立样本”中可实现。

  注意:在中,如果是整理成了列联表资料,需要用频数进行数据加权。变量编码为:①药物(名义):a=1,b=2,②疗效(度量):无效=1,有效=2,治愈=3,③频数(度量)。

  2、kruskal-wallis h检验:用于分组数大于2的情况,比如要比较3种或以上药物的疗效。实现方法与mann–whitney u类似。

  三、双向有序列联表

  1、行、列变量有序但属性不同

  比如这个例子:要比较某种药物对某种疾病的治疗效果,按年龄段的分组,要考察治疗效果是否与年龄段相关,整理成下表:

  行、列都是有序的,这是我们主要关心的:行列变量之间受否有相关性,如果有相关性,是线性相关还是曲线关系。可以选择的方法如下:

  (1)spearman等级相关:检验有无相关性,基于卡方检验,在中“分析->相关->双样本”中可实现。

  (2)线性趋势卡方检验:检验有无线性关系,基于卡方检验,“分析->交叉表”卡方结果表格中的“线性和线性组合”就是。

  2、行列有序且属性相同

  (1)行列变量独立

  通常是为了检验一致性。比如用两台仪器对同一样本进行检验,结果分为阴性、阳性,现在要比较两台仪器的结果是否据有一致性。整理成下表:

  常用的方法为:

  kappa一致性检验:h0为行列变量无一致性。在中“分析->描述性统计->交叉表”中可实现。

  (2)配对行列表

  行列变量为配对资料,比如有某种药物可以缓解某种疾病的某种症状,在同一个患者身上比较用药前后的症状,评价药物的资料效果,列成下表:

  可以选用的统计方法:

  (1)mcnemar检验:仅用于2×2列联表。基于卡方分布。在中“分析->描述性统计->交叉表”中可实现。本检验与pearson卡方检验具有同一性,使用条件必须满足pearson卡方检验的条件。如果条件不能满足,需要进行yate校正。

  (2)bowker检验:是mcnemar检验的扩展,用于分类数目大于2的配对列联表分析。在中“分析->描述性统计->交叉表”中可实现。

来源:
爱科学

上一篇:kaplan-meier生存分析中三种检验方法的比较

下一篇:or与rr值的区别和联系

登录注册
欢迎内容投稿或举报!e-mail: ikx@ikx.cn
凯发天生赢家一触即发官网 copyright © 爱科学 iikx.com "));
网站地图