回归分析的注意事项:
01 定性分析是前提。
在应用相关和回归分析时,一般分为定性分析和定量分析两个阶段,其中定性分析虽然并不复杂,但也及其重要。通过定性分析,我们来判明分析的变量之间是否存在相互依存关系,而后才能转入定量分析。需要指出的是,不能不加分析地,将两个变量凑合在一起进行定量分析,这样往往会得出虚假相关的结论。
比如,泰勒·维根在《虚假相关》(spurious correlations)一书中,列举了很多风马牛不相及的相关案例,例如美国人造黄油的人均消耗量和缅因州离婚率的相关性。感兴趣的同学可以阅读一下哦!
02 确定变量是关键。
回归分析是用于分析一个事物如何随其他事物的变化而变化,因此在进行回归分析时,十分关键的一步就是,确定哪个事物是需要解释的,即哪个变量是被解释变量(记为y);哪些事物是用于解释其他变量的,即哪些变量是解释变量(记为x)。
回归分析正是要建立y关于x的回归方程,并在给定x的条件下,通过回归方程预测y的平均值,这点是有别于相关分析的。
一般来说,只需要进行相关分析时,可以不区分因变量和自变量。但是,当进行回归分析时,一定要区分因变量和自变量,而且,因变量和自变量在回归方程中的地位不可倒置。
03 选用函数有讲究。
为了反映解释变量和被解释变量之间的有机联系,在回归分析中有多种可供选择的函数,即定量分析数学表达式。这里就涉及到如何根据变量之间的客观联系来选用正确的函数这个问题。
通常,我们在专业知识和理论以及实践经验的基础上,还需借助相关图法(比如观察散点图),来判明相关和回归的性质,寻找合适的回归线,然后选用正确的数学表达式。
04 外推预测需谨慎。
我们利用拟合的数学表达式所取得的回归方程,均是在一定范围内的有限资料计算得到的。理论上来说,其有效性只适用于该范围内,不适用于该范围外,即只适用于内插推算,不宜用作外推预测。
当然,通过客观联系建立起来的回归方程,如果通过相关系数的显著性检验,在一定的概率保证程度下,可用作近期预测。需要提醒的是,预测越远,可能误差就越大哦!
最后,让我们再总结一下:
定性分析是前提,确定变量是关键;
选用函数有讲究,外推预测需谨慎。
下一篇:线性回归分析的思路梳理