计量经济学第四章3多重共线性



《计量经济学第四章3多重共线性》由会员分享,可在线阅读,更多相关《计量经济学第四章3多重共线性(38页珍藏版)》请在文档大全上搜索。
1、 一、多重共线性的概念一、多重共线性的概念 对于模型:对于模型: Y Yi i= = 0 0+ + 1 1X X1i1i+ + 2 2X X2i2i+ + + k kX Xkiki+ + i i i=1,2,ni=1,2,n 其基本假设之一是解释变量之间是互不相关的。其基本假设之一是解释变量之间是互不相关的。如果存在不全为如果存在不全为0 0的数的数c c1 1、c c2 2、c ck k,使,使 c c1 1X X1i1i+ +c c2 2X X2i2i+c ck kX Xkiki=0=0 i i=1,2,=1,2,n n 即:某个解释变量完全可以由其它解释变量的线性组合来表示即:某个解释变
2、量完全可以由其它解释变量的线性组合来表示 则称为解释变量间存在则称为解释变量间存在完全共线性完全共线性(perfect multicollinearityperfect multicollinearity)。)。 完全共线性与近似共线性完全共线性与近似共线性如果存在不全为如果存在不全为0 0的数的数c c1 1、c c2 2、c ck k,使,使 c c1 1X X1i1i+ +c c2 2X X2i2i+c ck kX Xkiki+ +v vi i=0=0 i i=1,2,=1,2,n n 即:某个解释变量近似地可以由其它解释变量的线性组合来表示即:某个解释变量近似地可以由其它解释变量的线性
3、组合来表示 则称为解释变量间存在则称为解释变量间存在近似共线性近似共线性(approximate multicollinearityapproximate multicollinearity) 。 共线性示例共线性示例X1X2X31050521575751890972412012930150152 X2=5X1 X2=5X1 完全共线性完全共线性 X3=5X1+V X3=5X1+V 近似共线性近似共线性knnnkkXXXXXXXXXX212221212111111 完全共线性下,完全共线性下,X X中至少有一列向量可由其他列向量(不包括第一列)中至少有一列向量可由其他列向量(不包括第一列)线性
4、表出,线性表出,这意味着:这意味着:秩秩(X)(X) X X非列满秩非列满秩 (XX)(XX)不满秩不满秩 (XX)(XX)-1-1 不存在不存在 无法得到参数的估计量。无法得到参数的估计量。XY的OLS估计量为:YXXX1)(例:例:对对离差形式离差形式的二元回归模型的二元回归模型如果两个解释变量完全相关,如如果两个解释变量完全相关,如x x2 2= = x x1 1,则,则这时,只能确定综合参数这时,只能确定综合参数 1 1+ +2 2的估计值:的估计值:这一后果的实际意义是:这一后果的实际意义是:无法得到回归系数的唯一解无法得到回归系数的唯一解,但可以得到这些,但可以得到这些系数的线性组
5、合的唯一解系数的线性组合的唯一解Y= 0+ 1X1+ 2X2+ Y= 0+( 1+ 2) X1+ 2 2、近似共线性下解释变量的单独作用无法区分、近似共线性下解释变量的单独作用无法区分实际问题中的直接表现是:模型的回归系数经常表现出实际问题中的直接表现是:模型的回归系数经常表现出反常的现象!反常的现象! 例如例如 1 1本来应该是正的,结果却是负的。本来应该是正的,结果却是负的。 经验表明,经验表明,如果存在这种反常情形,应该首先怀疑多重共线性。如果存在这种反常情形,应该首先怀疑多重共线性。 经典假设下,回归系数经典假设下,回归系数jj表达了在其它解释变量不变的情形下,表达了在其它解释变量不变
6、的情形下,XjXj对对Y Y的的单独作用(净影响)单独作用(净影响) 如果模型中两个解释变量具有线性相关性,例如如果模型中两个解释变量具有线性相关性,例如X X2 2= = X X1 1 ,这时,这时,X X1 1和和X X2 2前的参数前的参数 1 1、 2 2并不反映各自与被解释变量之间的结构关系,而是并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的反映它们对被解释变量的共同影响共同影响 从而解释变量的单独作用无法无区分,从而解释变量的单独作用无法无区分, 1 1、 2 2失去了应有的经济含义失去了应有的经济含义3 3、近似共线性下、近似共线性下OLSOLS估计量的方差变
7、大估计量的方差变大近似共线性下,可以得到近似共线性下,可以得到OLSOLS参数估计量,并且可以证明,此时参数参数估计量,并且可以证明,此时参数估计量依然满足线性、无偏和有效性,即估计量依然满足线性、无偏和有效性,即OLSOLS依然是依然是BLUEBLUE但是,此时但是,此时参数估计量的方差会增大参数估计量的方差会增大。参数估计量。参数估计量方差方差的表达式为的表达式为由于由于|XX|XX| 0 0,引起,引起(XX) (XX) -1-1主对角线元素较大,使参数估计值的方主对角线元素较大,使参数估计值的方差增大差增大12)()(XXCov这意味着:这意味着: (1 1)无法精确的估计参数(以较高
8、的精度估计参数)无法精确的估计参数(以较高的精度估计参数) (2 2)基于参数估计量的标准差的变量显著性检验失效)基于参数估计量的标准差的变量显著性检验失效以二元线性模型以二元线性模型 Y=Y= 0 0+ + 1 1X X1 1+ + 2 2X X2 2+ + 为例为例: : 2221221212221222122211121)(1/)()()var(iiiiiiiiiixxxxxxxxxxXX2221221)(iiiixxxx恰为恰为X X1 1与与X X2 2的线性相关系数的平方的线性相关系数的平方r r2 2由于由于 0 0 r r2 2 1 1,故,故 1/(1- r1/(1- r2
9、2 ) ) 1 1212211var()1ixr 方差膨胀因子方差膨胀因子 (Variance Inflation Factor, (Variance Inflation Factor, VIFVIF) )显然:多重共线性的存在使得参数估计值的方差增大,其增加的倍数可以显然:多重共线性的存在使得参数估计值的方差增大,其增加的倍数可以采用采用1/(1-r1/(1-r2 2) )衡量衡量当当完全不共线完全不共线时时, , r r2 2 =0=0 2121/)var(ix当当近似共线近似共线时时, , 00 r r2 2 10.80.8,比较严重,比较严重 0.90.9,非常严重,非常严重 若在若在
10、OLSOLS法下法下,出现以下现象,则可能意味着共线性的存,出现以下现象,则可能意味着共线性的存在:在: a a、系数估计值的符号不合常理;系数估计值的符号不合常理; b b、R R2 2与与F F值较大,方程具有显著性,但各参数估计值的值较大,方程具有显著性,但各参数估计值的t t检检验值均较小,多个解释变量并不显著验值均较小,多个解释变量并不显著 说明各解释变量对说明各解释变量对Y Y的联合线性作用显著,但各解释变的联合线性作用显著,但各解释变量间存在共线性而使得它们对量间存在共线性而使得它们对Y Y的独立作用不能分辨,故的独立作用不能分辨,故t t检检验不显著。验不显著。 2 2、经验判
11、断法、经验判断法 将每个解释变量将每个解释变量X Xi i对其它解释变量对其它解释变量X Xj j进行回归,进行回归, 观察其拟合优度观察其拟合优度R R2 2和和F F检验值,如果某个检验值,如果某个R Ri i2 2接近接近1 1,F Fi i显著超出临界值,则表明该显著超出临界值,则表明该X Xi i与其它解释变量存在与其它解释变量存在多重共线性。多重共线性。 3 3、辅助回归检验法、辅助回归检验法 计算每个回归系数的计算每个回归系数的VIFVIF或或TOLTOL 方差膨胀因子越大(或容忍度越小),表明模型的多重方差膨胀因子越大(或容忍度越小),表明模型的多重共线性越强。共线性越强。 当