分类:经济学论文范文 时间:关注:(1)
型。
从上面得到的结果中我们可以看到得到的回归模型是显著的(Pr > F的值<.0001),但在显著性水平 时回归系数却是不显著的(由Pr > |t| 值)。模型显著,但回归系数却不显著,这是由于变量之间存在共线性所致。且由Parameter Estimate的值我们可以看到electricity,cement 和intcircuit的估计系数都为负值,这与实际情况不相符合,这也说明变量之间存在共线性的关系。
2.共线性诊断
从上面的分析中我们看到回归模型显著,但回归系数却不显著,且有变量回归估计系数为负值与实际情况不相符合,这些可能都是由于自变量之间存在共线性的原因。
所谓共线性问题是指拟合多元线性回归时,自变量之间存在线性关系或者近似线性关系。自变量之间的线性关系将会隐蔽变量的显著性,增加参数估计的方差,还会产生一个很不稳定的模型。
共线性诊断的方法是基于对自变量的观测数据构成的矩阵 进行分析,使用各种自变量间相关性的指标。共线性诊断常用统计量由方差膨胀因子VIF、条件指数和方差比例等。
方差膨胀因子VIF是指回归系数的股价由于自变量共线性使得方差增加的一个相对度量。对第 个回归系数 ,它的方差膨胀因子定义为:

其中 是自变量 对模型中其余自变量线性回归模型的 平方。
一般建议:如果 ,则表明模型中的自变量有很强的共线性。
若自变量的交叉乘积矩阵 的特征值为 ,则X的条件数 就是刻画矩阵的奇异性的一个指标,故称 为条件指数。
一般认为,如果条件指数值在10至30之间为弱相关;在30至100之间为中等相关;大于100表明有强相关。
对于大的条件指数,还需要找出那些变量间存在强的线性关系。因为每个条件指数对应一个特征向量,而大的条件指数相应的特征值较小,故构成这一特征向量的变量间有近似的线性关系。在统计中用方差比例来说明各个自变量在构成这个特征向量中的贡献。
一般认为:在大的条件指数中由方差比例大于0.5的自变量组成的变量子集就认为是相关变量。
我们只需在上面reg过程后加上vif collin 选项就可以得到共线
性的诊断结果了。程序如下:
proc reg data=industry corr;
model steel=cloth colortv coal crudeoil electricity pigiron cement car intcircuit/vif collin;
得到的方差膨胀因子见结果1种的variance Inflation列。可以看到所得到的方差膨胀因子的值全部大于10,最大值为1024.20911说明自变量之间存在严重的相关关系。得到的方差比例见结果2。 
可以看到条件指数最大的是433.33507。由其对应的行的方差比(Proportion of Variation)我们可以看到coal,crudeoil,electricity和pigiron的方差比都大于0.5说明它们组成了相关变量集。
3. 共线性的处理
通过前面的共线性诊断,