一、为什么需要重复测量设计.
1.举个例子,假如我们想比较3个班级学生的数学成绩,只用一次考试的分数固然可以得出其是否存在差异的结论。但仔细想想,仅仅一次数学考试可能受到较多的偶然因素影响,并不能准确地反映真实情况。而用一个学期内两次、三次或者更多次数学考试的分数来进行综合衡量,所得出的结果会更加可信。这里的两次、三次或者更多次数学考试分数就是一种重复的测量。
2.有时候,我们不但对不同的处理因素感兴趣,还对不同处理下的时间变化趋势感兴趣。例如,研究者不仅关注两种药物对于某疾病指标的影响是否存在差异,还关注在服药后的第1天、第2天、第3天这3个不同时间点的效果是否也有所不同。这里的第1天,第2天,第3天的疾病指标测量就是重复测量。
二、重复测量设计的优缺点.
优点:相同个体的多次使用,克服了个体间的变异。与此同时,也就不需要花费过多的时间和精力去纠结的问题。
缺点:
1.其它随时间变化的因素可能会影响研究结果。例如气温,三次数学考试中,有两次天气温度都是适中的,但第三次却突然迎来大升温。有些同学可能怕热,心情烦躁,做题效率低下。
2.滞留效应、潜隐效应、学习效应。
三、重复测量资料的方差分析需要满足的假定.
1.正态性。重复测量资料的方差分析可以适当放宽因变量的正态性假定(近似正态或者不过分违背正态即可)。如果严重违背正态性假定,一般有两种应对策略:一是对数据进行转化,使得转化后的数据满足正态性;二是干脆不使用方差分析,而是考虑是否存在与之对应的非参数检验方法。
2.球形性假定(sphericity)。有点让人联想到普通线性回归中的球形扰动项假定。不同测量时点的方差相等,且协方差为0。因为方差分析要求观测值间相互独立,协方差为0正是保证了不同时间点的观测值不相关。如果不满足该假定则需要对检验方法进行校正。
四、实例分析.
下面分别以单因素和两因素的重复测量资料方差分析为例,讲解中的具体操作和输出结果解读。其中,两因素的重复测量方差分析又包括:一个个体间(between-subjects)因素和一个个体内(within-subjects)因素的两因素重复测量方差分析;两个都是个体内因素的两因素重复测量方差分析。
1.单因素重复测量资料的方差分析.
为研究某药对慢性乙型肝炎患者谷丙转氨酶(简称alt,u/l)的影响,10名慢性乙肝患者同时服用该药,并在服药前、服药后10周、20周、30周时分别测定患者的alt,试分析乙肝患者的alt在不同时间点是否存在差异?数据格式和数据如下所示:
先进行:分析→描述统计→探索,然后将四个时间点变量t0,t1,t2,t3拖入因变量列表框中。
点击右侧图,勾选含检验的正态图,点击继续和确定,得出结果。
由于较少,我们直接看shapiro-wilk结果。结果显示,t1和t2组的alt数据不满足正态性,不过p值并非很小,分别为0.013和0.038。本例中我们可以默认其并不严重违反正态性假定,因此继续执行方差分析。
方差分析:分析→一般线性模型→重复测量。将因子1重命名为time(也可以命名为其它任何你想命名的名称),级别数中填4,因为本研究中有4个时间段的重复测量。再将测量名称命名为alt,因为alt是研究关注的结局指标(也可以选择不命名)。完毕后点击左下角定义。
将四个时间点变量拖入主体内变量框中。
右边选项中模型、对比、事后比较均保持默认即可。点击图,将time拖动至水平轴,然后点击添加和继续。em平均值中,将time拖入右侧显示下列各项平均值框中,并勾选上比较主效应,多重比较方法根据需要选择lsd或bonferroni,本例选择的是bonferroni,然后点击继续。
在选项中,勾选描述统计和效应量估算,然后点击继续和确定,得出一堆眼花缭乱的结果。
结果的解读(挑重点):先看球形检验结果。如果通过球形检验,则直接看主体内效应检验第一行的结果。本例中球形检验结果的p值小于0.05,不满足球形性假定。不满足球形性假定进行方差分析会增加犯i类错误的概率。此时我们通常有两种选择。一是进行校正,给出了三种校正方法,它们的f统计量都等于11.139,但是p值不同,因为这些校正方法都是对自由度进行校正。我们一般看第二行格林豪斯(greenhouse)校正的结果,它的p值等于0.002(确实比第一行的p值要保守),说明四个时间点上至少有两个时间点的alt值存在差异。
二是看多元方差分析的结果,因为多元方差分析不像重复测量方差分析那样对球形性假定作出要求。会给出四个多元统计量,它们所对应的结果不出意外都是一致的。本例中,四个p值都小于0.05,说明四个时间点上至少有两个时间点的alt值存在差异,和上述校正得出的结论相同。如果多元和校正出现不一致的结论,我们一般以多元方差分析所对应的结论为准。
那么具体哪些时间点上存在差异呢?这还要看两两比较的结果。本例中bonferroni两两比较的结果显示:时间点1和时间点2不存在差异,时间点1和时间点3、4均存在差异。时间点2和时间点3、4均不存在差异。时间点3和时间点4之间也不存在差异。
2.两因素重复测量资料的方差分析(一个个体间因素 一个个体内因素).
两因素重复测量资料的方差分析比单因素重复测量资料的方差分析要稍微复杂一点,因为结果的解读要根据交互项是否显著来进一步确定。
欲探讨某药物对癌细胞株增殖的影响,分别在细胞培养后24h、48h、72h、96h检测实验组和对照组(对照组不用药)细胞株的细胞抑制率(%)。试分析该药物对癌细胞是否有抑制作用?数据格式和数据如下所示:
这里实验组5个癌细胞株和对照组5个癌细胞株是不同的5个研究对象,因此实验和对照是个体间的处理因素。四个时间点的重复测量是对每一组的相同5个癌细胞株的重复测量,因此它是个体内的处理因素。这种一个个体间因素和一个个体内因素的重复测量资料方差分析也叫做混合方差分析(mixed anova)。
首先还是进行。需要检验2✖4=8组的正态性,因为共有8种组合。具体操作和上述单因素重复测量方差分析中的一致,这里便不再赘述,直接上结果。可以看到p值均大于0.05,说明正态性是满足的。
方差分析:分析→一般线性模型→重复测量。将因子1重命名为time,级别数中填4,因为本例中也是4个时间段的重复测量,然后点击添加。这些步骤和单因素重复测量方差分析一致。不同之处在于,将四个时间点变量拖入主体内变量框后,还需要将分组变量group拖入主体间因子框中。
右边选项的模型中,默认为全因子。图中,将time拖入水平轴,group拖入单独的线条,然后点击添加和继续。这里你也可以将group拖入水平轴,time拖入单独的线条。你还可以将这两种不同水平轴的图都添加上。本例中,我们选择都添加上进行演示。
事后比较保持默认即可。如果本例中group有三组,则需要将group纳入至下列各项的事后检验,并选择一种多重比较的方法。
em平均值中,将group,time,group*time拖入显示下列各项的平均值。并勾选上比较主效应,多重比较方法根据需要选择lsd或bonferroni,本例选择bonferroni。选项中勾选描述统计、效应量估计和齐性检验。这里需要进行方差齐性检验是因为我们测量了两组不同的5个癌细胞株。上文中的单因素重复测量没有勾选齐性检验,因为它是对同一组相同的研究对象的重复测量。完成这些操作后,我们点击继续和确定,便可得出一堆眼花缭乱的结果。
结果的解读(挑重点):首先看球形检验结果,p=0.185大于0.05,满足球形性假定。因此直接看主体内效应检验表中的第一行和第五行。第一行的p值小于0.05,这说明不同时间点的细胞抑制率存在差异;第五行的p值小于0.05,说明时间点和组别的交互项也显著,这意味着不同时间点的细胞抑制率的差异在不同的组别中也有所不同(或者你也可以理解为,实验组和对照组的细胞抑制率差异在不同的时间点也有所不同)。
轮廓图可以帮助我们在一定程度上佐证交互项是否显著。不难发现,实验组和对照组的癌细胞抑制率随着时间的变化并非呈现一致的趋势,即线段不平行。这和交互项的p值小于0.05是吻合的。
再来看组间比较的结果。两个group组之间的差异也是显著的,差值为0.541。但由于交互项显著,直接看主效应已经没有意义了,因为它是对四个时间点癌细胞抑制率均值的比较所得出的结果。以时间点1为例,0.541它会高估差异的大小;以时间点4为例,0.541它会低估差异的大小。只有在不存在交互作用的情况下,即两线段平行时,差异值0.541在四个时间点才都能适用。同理,由于交互项显著,直接看四个时间点的两两比较结果也没有意义了,因为它没有对实验组和对照组进去区分后进行四个时间点的两两比较。
为进一步进行简单效应分析,我们先返回到重复测量的界面,点击粘贴进入编程界面,对原有编程作出如下颜色加深部分的修改,然后点击运行。
会给出新的结果。下图中,左边是在不同时间点下的实验组和对照组的比较;右边是在实验组和对照组下的不同时间点的两两比较。
3.两因素重复测量资料的方差分析(两个个体内因素).
两个个体内因素的两因素重复测量资料是指:一批研究对象参加了两个处理因素的所有可能的组合的实验。例如我们想研究光亮(明亮、黑暗)和声音(嘈杂、安静)对于个体放松程度(一个得分指标,越高说明越放松)的影响,两种不同水平的光亮和两种不同水平的声音将会产生四种组合——明亮 嘈杂、明亮 安静、黑暗 嘈杂、黑暗 安静。10例研究对象均参与所有可能组合的实验,数据格式和数据如下所示:
为节省篇幅我们跳过,注意实际操作中不能漏掉这一步哈。
方差分析的操作和上述两种方差分析的主要区别在于,我们要命名两个主体内因子——light和sound,然后点击定义,将其拖入主体内变量框中。
右边的选项中,点击图,将light拖入水平轴,sound拖入单独的线条,点击添加和继续。
em平均值中,可以不用勾选比较主效应,因为这里的light和sound都是两水平的。如果有一个因素是三水平的,则需要勾选上。
选项中,勾选描述统计和效应估计量即可。点击继续,最后点击确定,得出结果。
结果解读(挑重点):由于light和sound都是两水平的处理因素,球形检验无法得出结果,所以在本例中就不用看了。如果有一个因素是三水平的,则需要根据球形检验的结果判断主效应是否显著。
我们发现主效应light和sound,以及交互项light*sound均显著。
由于交互项显著,直接看主效应就没有意义了,我们还要进一步进行简单效应分析。light和sound均为两水平,所以这里的简单效应分析就只要开展配对的t检验。具体操作为:分析→比较平均值→成对样本t检验。控制一个处理因素不变的情况下,比较另一个因素的两水平。
配对t检验的结果显示:在同为嘈杂的情况下,明亮与黑暗对个体放松程度的影响没有差异,但是在同为安静的情况下,明亮与黑暗对放松程度的影响存在差异。这些是主效应不能告诉我们的结果。同理,在同为明亮的情况下,嘈杂与安静对放松程度的影响没有差异,但在同为黑暗的情况下,嘈杂与安静对放松程度的影响有差异。
总结
重复测量资料的方差分析至少会涉及到一个个体内的因素。本文中的三个例子分别为:一批相同的研究对象 一个个体内处理因素;多批研究对象进行不同的处理 一个个体内处理因素;一批相同的研究对象 两个个体内处理因素。后两者均可以被称为两因素重复测量资料,相比单因素重复测量资料的分析,两因素的分析考虑到了交互项,因此其结果的解读依赖于交互项是否显著。交互项不显著则可以直接看主效应;交互项若显著,则要看简单效应。