:线性回归、、cox比例风险模型三大回归的基本应用条件。
三大回归分析对变量的基本要求:
线性回归,一般应用于回归分析的y,也就是结局变量(反应变量)是定量数据;则可以是二分类、无序多分类和有序多分类;cox比例风险模型结局变量两个,分别是生存时间(定量)与预后结局(二分类)。
自变量方面,三种方法有相似又不同的要求。
线性回归:总体上是line的要求,也就是线性、正态性、方差齐性、独立性。
线性:解释变量x和反应变量y必须要有线性关系吗?不是!只有当x是定量数据或者等级数据(不设哑变量)时,才要求x与y有线性的关系。当x是二分类或无需多分类,没有线性条件的要求。独立性:要求y各观察值相互独立吗? 不是,是要求残差是独立的。正态性:要求y各观察值正态分布吗? 不是,是要求残差正态分布。方差齐性:要求不同的解释变量x时,反应变量y方差相等吗?没错,但是对于多因素回归分析,更加合理的理解是在不同y预测值情况下,残差的方差变化不大。
,具体来说,主要是两个条件,一个是独立性、一个是线性。同样独立性,要求观察值残差是独立的,而线性,则要求自变量x与应变量y的logit(p)转换后成线性关系成立。
cox回归,主要还是线性、独立性的条件,除此之外,还有个重要的条件是等比例风险假定的条件。
回归的应用条件不满足怎么办?
三种回归都需要线性条件的成立。线性条件如果不成立,可以对自变量进行分组并进行哑变量设置,也可以尝试进行指数化处理,比如e^x, 或者x^2等,也可以采用利用loess、限制性立方条样图的的方式开展非线性回归。
独立性问题同样在三种回归均有要求。如果观察值之间不独立,是为聚集性数据,则建议考虑随机效应模型,比如线性混合模型、广义线性混合模型、多水平模型等。
线性回归有正态性和方差齐性的条件,若方差齐性条件不成立,则可考虑加权最小二乘法方法开展线性回归,若正态性不成立,可以考虑对因变量y进行数据转换比如log转换、box-cox转换,或者直接对定量的因变量转换为分类结局而后开展logistic分析。
cox回归有等比例风险的前提假设,如果等比例风险的前提假设不成立,则一般建议采用限制性平均生存时间来代替中位生存时间时间来开展生存分析的描述与比较。