实现连续变量与分类变量的转换。在进行数据分析时,常需要对原始数据进行适当的转换。也许需要将连续变量转换为分类变量(比如:将年龄转换为<30岁组和≥30岁组),或者将分类变量重新编码(比如:将血型a、b、o、ab转换为a型和其他),又或者要生成新变量,都可以帮您实现。
首先是我们的示例数据,变量分别是血型(1=a,2=b,3=o,4=ab)、年龄、左右耳听阈、吸烟史和饮酒史。
我们先说说如何生成新变量。
示例数据有左耳听阈、右耳听阈,若我们想看看左右耳听阈之差呢?也就是说,我们要根据现有的左右耳听阈,新生成一个左右耳听阈之差的变量。在工具栏中选择转换-计算变量,弹出对话框如下。首先需要定义新变量的名称,也就是图中的目标变量。在这里,我们定义为左右耳听阈之差。此外,我们可以选择类型和标签定义变量类型和标签。然后,在右侧文本框写出数字表达式,即可。当然,您也可以通过函数组和如果进行公式的书写和条件的设置。
接下来,我们探讨下变量的重新编码。
示例数据的年龄是以连续变量存储的,我们如何将其转换为分类变量呢?在工具栏中选择转换-重新编码为不同变量,弹出对话框如下。这里说一句,转换-重现编码为相同变量虽说也可以助我们达到目的,但因其覆盖原始变量的劣势,不推荐使用。
将年龄选入中间的文本框,此外,需定义输出变量的名称。接下来,选择旧值和新值定义编码规则。比如,我们在旧值中写入0到29岁的范围,新值定义为1,点击添加,直到完成重新编码。返回到上图页面,点击更改。至于血型的重新编码,操作大体是一样的,您不妨亲身尝试一下。
关于范围的设置,需要明确一下端点的归属。如图,我们定义0到29岁为1组,也就说≥0和≤29的都被分到1组。另外,文本框中关于旧-新的赋值,安规则顺序执行。比如,0到29为1;29到49为2,那29是被分到1组还是2组呢?按照规则顺序,第1条>第2条>第3条,我们就可以知道29会被分到1组。
倘若,我们是这样的赋值规则:第1条:29到49;第2条:0到29。那29就是2组了。亲证有效哦!
下一篇:病例-对照研究还是病例对照研究?