由以上数据,我们可以看出:数据存在严重多重共线性问题。需要对此模型进行修正。
用逐步回归法对多重共线性进行修正。由SPSS软件得到如下数据:
从以上数据可知,经过逐步回归之后,只有能源生产总量这一个解释变量进入了模型,而且其VIF值为1.000符合标准。(VIF的大小反映了解释变量之间是否存在多重共线性,经验表明,VIF≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种共线性可能会过度的影响最小二乘估计。)但由于实际经验及研究表明,能源消耗总量与GDP也有高度相关关系,所以需要把不变价GDP也加入到模型中。所以最后得到的模型如下:
其中, 的系数由OLS估计得到。
4.自相关的检验与修正
采用DW检验法检验模型是否存在自相关。用SPSS软件得到如下数据:
由以上图表可知,DW值为1.026。取显著性水平 时,临界值d L和d U分别为1.270和1.563。因为0≤DW≤DL,模型存在正的自相关,需要对模型进行修订。
用科克伦-奥克特迭代法对自相关进行修订。,用SPSS软件,采用9次迭代法,对模型进行分析后,得到如下数据:
经过迭代后,基本消除了自相关。得到的模型如下所示:
5.异方差的检验与修正
分别做 与Y的散点图:
由图形可以看出:能源生产总量与Y不存在自相关关系,而GDP与Y几乎也不存在自相关关系。为了得到更确定的答案,还需要用G-Q检验法对模型进行异方差的检验。由残差平方与GDP的散点图,可知模型可能存在升序排列的异方差。所以对模型数据进行升序排列,排除中间四分之一的数据,分别对余下的数据进行回归分析,得到如下数据:
方差分析
df
SS
MS
F
回归分析
1
1498745586
1.5E+09
271.1062
残差
9
49754337.26
5528260
总计
10
1548499924
方差分析
df
SS
MS
F
回归分析
1
15837859524
1.58E+10
905.3101
残差
8
139955216.8
17494402
总计
9
15977814740
计算统计量
=139955216.8/49754337.26=2.81
=0.05,查F分布表,的临界值为F(0.05)(11,11)=2.82。因为2.81<2.82,所以认为模型中不存在异方差。五、模型总结
本次分析一开始选择了比较多的变量作为分析依据,但是通过各种检验和调整,最终结果体现,影响能源消耗总量的主要因素有能源生产总量与GDP。能源生产总量是消耗总量的直接制约因素。GDP的增长是能源消耗总量曾长的根本决定因素。
所以最终确定的模型为经过科克伦—奥科特九次迭代法之后,得到的模型
同时,也得到了如下数据:
由以上数据可以看出:
可决系数R=0.994,表明样本数据与回归方程拟合优度很好。
能源生产总量系数的t值为 26.491,表明能源生产总量对能源消费总量由显著性影响。
可比价GDP系数的t值为1.332,t值不是很大,表明模型仍存在一定问题,但由于知识水平与技术的限制,我不能做出更好的调整,有待日后修复。
参考文献:
1.《中国统计年鉴2007》
2.《计量经济学》
3.《SPSS统计软件分析应用》
4.《中国日报》