《计量经济学》分析报告
关于云南省固定资本形成总额
影响因素的计量分析
指导老师:沈鸣 班级:市调0901 姓名:陈妍琦
学号:2009161676
一、前言
在科技统计分析中,经常需要对与科技进步相关的经济发展质量进行反映,因而常常要面临有关资本指标的选择,其中有两个十分相似的指标,即资本形成和固定资本形成。
其实这个问题对大多数人来说并不是很困难,把握住核心的一点,即资本形成总额包括固定资本形成总额与存货增加就可以了。
本文旨在研究云南省的固定资本形成总额,固定资本形成总额可分为有形固定资本形成总额和无形固定资本形成总额。有形固定资本形成总额包括一定时期内完成的建筑工程、安装工程和设备工器 具购置(减处置)价值,以及土地改良、新增役、种、奶、毛、娱乐用牲畜和新增经济林木 价值。无形固定资本形成总额包括矿藏的勘探、计算机软件、娱乐和文学艺术品原件等获得减处置。
固定资本形成都是生产总值统计中的主要指标。它指的是以货币形式表现的、在一定时期内建造和购置固定资产的工作量以及与此有关费用的总称。固定资产投资统计中的指标,有分月和分季度的数据;固定资产投资额存在着重复统计,比如上一期留存下来的固定资产被其他生产单位在计算期购买或租赁而产生的费用,固定资本形成中则扣除了由于出售、易货交易和实物资本转移而转出的价值;在统计口径上,固定资产投资自1997年起,统计起点已由5万元提高到了50万元;固定资本形成中还包含部分无形资产的净增加额。
本文通过选择固定资本形成总额来观察云南省经济发展,希望可以起到一个概括性的作用。
一、 理论背景
云南省是一个内地省市,没有与其相连接的海域,且处于横断山脉的地理位置,造就了它的交通个方面的限制,与中国南部和中原地区的省市相比较,农作物的发展不如中原地区的鱼米之乡,相对偏远的地理位置对外商投资也有一定影响。
中华人民共和国成立以来,特别是改革开发以来,云南省的国民经济和各项社会事业进入了快速发展的时期。云南全省面貌发生了深刻变化,经济实力明显增强。云南经济发展迅速,提前二年实现人均1000美元的阶段性目标,以能源、通讯、交通为重点的基础设施不断改善,工业化进程明显加快。10多年来,云南经济保持了较快的增长速度,国内生产总值在全国的排序,由1980年的第22位,上升至1999年的第18位,以能源、通讯、交通为重点的基础设施不断改善,工业化进程明显加快。产业结构逐步得到调整,一批新的支柱产业正在兴起。农业的基础地位不断增强,农业经济持续发展,粮食生产连续获得丰收,1999年粮食产量达1300万吨。
云南省气候和地理位置的缘故,适合种植很多经济林木,期间可以饲养多种家禽,随着经济的发展,大片的土地得到了开发与利用。固定资本形成总额也呈上升的发展趋势,一切发展都呈现较好的趋势。影响固定资本形成总额的因素很多很多,在这里我们只几个主要的因素来讨论。固定资本形成总额与GDP,进口额,固定资产投资额,社会消费品零售总额,外商直接投资额等都有关系,在下文中主要就是对这几个因素进行了分析。
二、 模型的选择与建立
选取了以下五个解释变量,来考察对固定资本形成总额的影响:
Y:云南省固定资本形成总额,单位,亿元。 X1:云南省GDP,单位:亿元。 X2:云南省进口额,单位:亿元。
X3:云南省固定资产投资额,单位:亿元。 X4:云南省社会消费零售总额,单位:亿元。 X5:云南省外商直接投资额:单位:亿元。
Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + μ
一共有5个解释变量;β0为常数项;μ为随机误差项,描述变量外的因素
对模型的干扰。
四、数据来源与分析
1.原始数据
时间序列的变量及原始数据:由于解释变量和被解释变量中都是以“亿元”作单位,数据的口径均同质可比,没有实物量指标,故可用现价数据,而不用调整为可比价
2,在解释变量之间一一做散点图。
由散点图可看出,被解释变量Y与解释变量X1、X2、X3、X4、X5之间基本存在着线性关系,所以初步估计我所要建立的模型是直线模型。
6000
6000
40004000
Y
Y
2000
2000
00
2000
4000X1
6000
8000
00
100
200
X2
300
400
500
固定资本形成总额与GDP的关系 固定资本形成总额与进口额的关系
6000
6000
4000
4000
Y
2000
Y
2000
00
2000
X3
4000
6000
00
500
[***********]00
X4
固定资本形成总额与固定资产投资额的关系 固定资本形成总额与社会消费 品零售额的关系
Y
00
20
40
X5
60
80
100
固定资本形成总额与外商直接投资额
基本统计量
协方差
简单相关系数
五、模型估计
模型的初步估计与检验
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+μ
模型的回归分析
的T检验;R2表示该模型的可决系数;F表示对应的模型整体的F检验值,若出现*号则表明通过了显著性水平为0.05的F检验;若是偏回归系数和方程整体都通过了各自的假设检验,则“合格”一栏中注上“合”,若有任一项没有通过检验,则该栏注上“不”。
六、五元模型的检验
ˆ99.403620.674870x14.571649x20.056894x33.348834x43.532978x5回归方程:y
Dependent Variable: Y Method: Least Squares Date: 12/03/11 Time: 14:50 Sample: 1981 2010 Included observations: 30
C X1 X2 X3 X4 X5
R-squared
-99.40362 -0.674870 4.571649 -0.056894 3.348834 -3.532978
75.63059 0.364239 2.961426 0.421120 1.551115 5.489547
-1.314331 -1.852821 1.543732 -0.135102 2.158986 -0.643583
0.2012 0.0762 0.1357 0.8937 0.0411 0.5259
0.986175 Mean dependent var 901.1217
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.983295 S.D. dependent var 158.0640 Akaike info criterion 599621.8 Schwarz criterion -191.1110 F-statistic 1.560280 Prob(F-statistic)
1222.936 13.14073 13.42097 342.3919 0.000000
DW检验值是1.07
将Xi按升序排列,i=1,2,3,4,5;删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
分别用两个子样本做回归。求出大e和小e,并做F检验。
2
2
(一)处理自相关
对模型做广义一阶差分回归,得AR(1)= 0.372682,经差分后得到新序列,设为C1、Y1、X11、X21、X31、X41、X51、 生成新数据:
C1=1- 0.372682 补第一个数c1= (1-0.372682^2)^0.5 Y1=y-y (-1)* 0.372682 y1=y*(1-0.372682^2)^0.5 x11=x1-x1 (-1)* 0.372682 x11=x1*(1-0.372682^2)^0.5 x21=x2-x2(-1)* 0.372682 x21=x2*(1-0.372682^2)^0.5 x31=x3-x3(-1)* 0.372682 x31=x3*(1-0.372682^2)^0.5 x41=x4-x4(-1)* 0.372682 x41=x4*(1-0.372682^2)^0.5 x51=x5-x5(-1)* 0.372682 x51=x5*(1-0.372682^2)^0.5
Dependent Variable: Y1 Method: Least Squares Date: 12/05/11 Time: 14:20 Sample: 1981 2010 Included observations: 30
C1 X11 X21 X31 X41 X51
R-squared
Adjusted R-squared S.E. of regression Sum squared resid
-128.3329 -1.044183 7.741286 -0.411536 4.670127 -2.689317
107.8559 0.423228 3.366889 0.499486 1.836924 6.659050
-1.189855 -2.467190 2.299240 -0.823919 2.542362 -0.403859
0.2457 0.0211 0.0305 0.4181 0.0179 0.6899
0.974779 Mean dependent var 629.9881 0.969524 S.D. dependent var 154.6371 Akaike info criterion 573903.1 Schwarz criterion
885.8026 13.09690 13.37714
DW检验值是1.07
对新序列进行异方差检验
将Xi按升序排列,i=1,2,3,4,5;删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
分别用两个子样本做回归。求出大e和小e,并做F检验。 结果如下 :
2
2
(二)处理异方差
建立新序列:X32、X42、X52。
y1e
、
x11e
、
x21
e
、
x31e
、
x41e
、
x51e
,名称分别为Y2、X12、X22、
Genr e=abs(resid)
Ls y1/e c1/e x11/e x21/e x31/e x41/e x51/e Genr y2=y1/e Genr c2=c1/e Genr x12=x11/e Genr x22=x21/e Genr x32=x31/e Genr x42=x41/e Genr x52=x51/e
Dependent Variable: Y2 Method: Least Squares Date: 12/06/11 Time: 19:03 Sample: 1981 2010 Included observations: 30
C2 X12 X22 X32 X42 X52
-25.45045 -0.330301 1.262406 0.372116 2.148021 -5.964718
6.360935 0.031788 0.343434 0.050177 0.166206 1.216551
-4.001055 -10.39065 3.675837 7.416049 12.92382 -4.902976
11
0.0005 0.0000 0.0012 0.0000 0.0000 0.0001
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.999876 Mean dependent var 0.999850 S.D. dependent var 0.995524 Akaike info criterion 23.78563 Schwarz criterion -39.08642 Durbin-Watson stat
31.71469 81.37620 3.005761 3.286001 1.063735
检验子相关:
对新序列作回归分析,DW=1.063735,1.063735
(三)处理自相关
对模型做广义一阶差分回归,得AR(1)=0.689860,经差分后得到新序列 生成新数据:
C3=c2-c2(-1)* 0.689860 补第一个数:c3=c2*(1-0.689860^2)^0.5 Y3=y2-y2(-1)* 0.689860 y3=y2*(1-0.689860^2)^0.5 x13=x12-x12(-1)* 0.689860 x13=x12*(1-0.689860^2)^0.5 x23=x22-x22(-1)* 0.689860 x23=x22*(1-0.689860^2)^0.5 x33=x32-x32(-1)* 0.689860 x33=x32*(1-0.689860^2)^0.5 x43=x42-x42(-1)* 0.689860 x43=x42*(1-0.689860^2)^0.5 x53=x52-x52(-1)* 0.689860 x53=x52*(1-0.689860^2)^0.5
12
Dependent Variable: Y3 Method: Least Squares Date: 12/06/11 Time: 19:38 Sample: 1981 2010 Variable C3 X13 X23 X33 X43 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient 0.391886 -0.279838 1.227121 0.477512 1.650686 Std. Error 2.727082 0.033210 0.317253 0.040615 0.113147 t-Statistic 0.143702 -8.426241 3.867956 11.75710 14.58891 Prob. 0.8869 0.0000 0.0007 0.0000 0.0000 0.999936 Mean dependent var 10.04425 0.999922 S.D. dependent var 0.896565 Akaike info criterion 19.29189 Schwarz criterion -35.94546 Durbin-Watson stat
101.6979 2.796364 3.076604 1.436711
对新序列作回归分析,DW=1.436711,1.07
对新序列进行异方差的检验
13
(四) 处理异方差
建立新序列:y3/e1,c3/e1,x13/e1,x23/e1,x33/e1,x43/e1,x53/e1,名称分别为Y4, C4, X14, X24, X34, X44, X54.
Ls y3 c3 x13 x23 x33 x43 x53
Genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x23/e1 x33/e1 x43/e1 x53/e1 Genr y4=y3/e Genr c4=c3/e Genr x14=x13/e Genr x24=x23/e Genr x34=x33/e Genr x44=x43/e Genr x54=x53/e
14
Dependent Variable: Y4 Method: Least Squares Date: 12/06/11 Time: 21:21 Sample: 1981 2010 Included observations: 30
C4 X14 X24 X34 X44 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.144855 -0.278665 1.213997 0.483026 1.634462 -5.178781
0.296577 0.003018 0.030110 0.011597 0.026542 0.193573
0.488422 -92.34014 40.31842 41.65160 61.57945 -26.75358
0.6297 0.0000 0.0000 0.0000 0.0000 0.0000
0.999997 Mean dependent var 154.5967 0.999997 S.D. dependent var 1.067073 Akaike info criterion 27.32748 Schwarz criterion -41.16859 Durbin-Watson stat
604.8441 3.144572 3.424812 1.835773
对新序列作回归分析,DW=1.835773, du
将Xi按升序排列,i=1,2,3,4,5:;删掉中间的8个,将其余样本点划分为样本容量为11个的两个子样本。分别用两个子样本做回归,求出大e和小e,并做F检验。
2
2
15
F检验:R²=0.999997,F=( R²/k)/【(1- R²)/(n-k-1)】= >2.60 = F 0.05,5,25 至此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。但该模型的可决系数和调整可决系数均为1,表现出完全的线性关系,说明拟合程度高达100%,Y完全是由系统因素影响,不包含随机因素影响,模型不含误差项。而计量经济学模型一定含有误差项,故此,舍弃此模型。 得出的回归方程为: =0.144855-0.278665X1+1.213997X2+0.483026X3+1.634462X4-5.178781X5 解释变量X1和X5分别是GDP和外商直接投资额,在一般情况下,外商要不投资,要不不投资,是不会为负的,而GDP在一般情况下是会随着固定资本形成总额的增长而增长的,可是现在的回归方程告诉我们的是二者是相反的关系,这是不正常的,鉴于X1和X5的经济意义不合格,所以,舍弃五元模型
七,选四元模型X1,X2,X4,X5为解释变量
(一)回归方程:=-92.0768-0.632825X1+4.217241X2+3.161763X4-3.53677X5 因为可选模型列表中四元模型没有合格的,所以我们只能选取一个t、F检验最多的,故选取了此模型。
Dependent Variable: Y Method: Least Squares Date: 12/07/11 Time: 14:42 Sample: 1981 2010
C X1 X2 X4 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid
-92.07676 -0.632825 4.217241 3.161763 -3.536772
51.66947 0.185502 1.346983 0.685164 5.380610
-1.782034 -3.411416 3.130878 4.614607 -0.657318
0.0869 0.0022 0.0044 0.0001 0.5170
0.986164 Mean dependent var 901.1217 0.983951 S.D. dependent var 154.9294 Akaike info criterion 600077.8 Schwarz criterion
16
1222.936 13.07483 13.30836
Log likelihood Durbin-Watson stat
-191.1224 F-statistic 1.577758 Prob(F-statistic)
445.4792 0.000000
Dw=1.577758,因为1.14
将Xi按升序排列,i=1,2,4,5:;删掉中间的8个,将其余样本点划分为样本容量为11个的两个子样本。分别用两个子样本做回归,求出大e和小
2
e,并做F检验。
所以存在异方差
2
(二)处理异方差
建立新序列:
ye
、
x1e
、
x2e
、
x4e
、
x5e
,名称分别为Y1、X11、X21、X41、X51。
步骤:Ls y c x1 x2 x4 x5
Genr e=abs(resid) Genr y1=y/e Genr x11=x1/e Genr x21=x2/e Genr x41=x4/e Genr x51=x5/e
Dependent Variable: Y1 Method: Least Squares Date: 12/07/11 Time: 18:38 Sample: 1981 2010 Included observations: 30
Variable C1 X11 X21 X41 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient -49.94615 -0.522995 5.836265 2.510949 Std. Error 13.33871 0.087154 0.370207 0.288556 t-Statistic -3.744451 -6.000788 15.76489 8.701763 Prob. 0.0010 0.0000 0.0000 0.0000 0.997422 Mean dependent var 10.70524 0.997010 S.D. dependent var 0.736026 Akaike info criterion 13.54335 Schwarz criterion -30.63863 Durbin-Watson stat
13.46009 2.375909 2.609442 1.157854
自相关检验
Dw=1.157854,因为1.14
18
(三)处理自相关
对模型作广义差分回归,得到AR(1)= 0.794702,经差分后得到的新序列设为Y2 、X12 、X22 、X42 、X52
步骤:ls y1 c1 x11 x21 x41 x51 ar(1),得出ar(1)
Genr c2=c1-0.794702*c1(-1) 补数:genr c2=c1*(1-(0.794702)^2)^0.5 Genr y2=y1-0.794702*y1(-1) genr y2=y1*(1-(0.794702)^2)^0.5
Genr x12=x11-0.794702*x11(-1) genr x12=x11*(1-(0.794702)^2)^0.5 Genr x22=x21-0.794702*x21(-1) genr x22=x21*(1-(0.794702)^2)^0.5 Genr x42=x41-0.794702*x41(-1) genr x42=x41*(1-(0.794702)^2)^0.5 Genr x
=x-0.794702*x(-1) genr x=x*(1-(0.794702)^2)^0.5 19
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 11:42 Sample: 1981 2010 Included observations: 30
Variable C2 X12 X22
X42
Coefficient 0.083271 -0.637676 6.529361
2.701595
Std. Error 0.617952 0.128355 0.288388
0.421879
t-Statistic
0.134753 -4.968069 22.64090
6.403715
Prob. 0.8939 0.0000 0.0000
0.0000
X52
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-3.489938 1.514624 -2.304162 0.0298
0.998124 Mean dependent var 2.524238 0.997823 S.D. dependent var 0.633165 Akaike info criterion 10.02246 Schwarz criterion -26.12262 Durbin-Watson stat
13.57110 2.074841 2.308374 1.340395
对新序列做回归,得到DW=1.340395,DL
对其做异方差检验;
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
20
所以该序列存在异方差。 (四)处理异方差。
步骤:ls y2 c2 x12 x22 x42 x52, 产生新的新序列为:y3,c3,x13,x23,x43,x53 Genr e1=abs(resid) ls y2 c2 x12 x22 x42 x52, genr y3=y2/e1 genr x13=x12/e1 genr x23=x22/e1 genr x43=x42/e1 genr x53=x52/e1
21
Dependent Variable: Y3 Method: Least Squares Date: 12/10/11 Time: 12:10 Sample: 1981 2010 Included observations: 30
C3 X13 X23 X43 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-0.322984 -0.643542 6.658485 2.707576 0.184490 0.053605 0.165738 0.168476 -1.750689 -12.00526 40.17488 16.07103 0.0923 0.0000 0.0000 0.0000 0.999996 Mean dependent var 94.09417 0.999995 S.D. dependent var 0.971333 Akaike info criterion 23.58719 Schwarz criterion -38.96075 Durbin-Watson stat
457.0434 2.930717 3.164250 1.520684
对新序列做回归,得到DW=1.520684.落入不能确定的区间,所以认为存在自相关。
对该序列做异方差检验:
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(五)处理自相关
对模型作广义差分回归,得到AR(1)= 0.360707,经差分后得到的新序列设为Y2 、X14 、X24 、X44、X54
步骤:ls y3 c3 x13 x23 x43 x53 ar(1),得出ar(1)
Genr c4=c3-0.3607070*c3(-1) 补数:genr c4=c3*(1-(0.360707)^2)^0.5 Genr y4=y3-0.360707*y3(-1) genr y4=y3*(1-(0.360707)^2)^0.5 Genr x14=x13-0.360707*x13(-1) genr x14=x13*(1-(0.360707)^2)^0.5
22
Genr x24=x23-0.360707*x23(-1) genr x24=x23*(1-0.360707)^2)^0.5 Genr x44=x43-0.360707*x43(-1) genr x44=x43*(1-(0.360707)^2)^0.5
Dependent Variable: Y4 Method: Least Squares Date: 12/10/11 Time: 12:41 Sample: 1981 2010 C4 X14
-0.163418 -0.630842
0.215601 0.050277
23
-0.757963 -12.54735
0.4556 0.0000
X24 X44 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
6.575481 2.671679 0.163660 0.157460 40.17777 16.96737 0.0000 0.0000 0.999997 Mean dependent var 60.18308 0.999996 S.D. dependent var 0.935359 Akaike info criterion 21.87241 Schwarz criterion -37.82858 Durbin-Watson stat
493.4388 2.855239 3.088772 1.932591
对新序列做回归,得到DW=1.932591。1.74
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8
F检验:R²=0.999997,
F=( R²/k)/【(1- R²)/(n-k-1)】= 2083327>2.74 = F 0.05,4,25
至此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。
根据经验得出: 解释变量X1有GDP与被解释变量固定资本形成总额应该是正向的比例关系,即解释变量X5外商直接投资额增大,被解释变量固定资本形成总额也增大,所以经济意义不合格,故舍弃该模型。
八,选三元模型X1,X2,X4
根据上面的解释变量回归列表,我们可知所有的三元模型的组合中,只有变量X1,X2,X4合格,所以选择其为模型进行处理。 模型为:
ˆ-88.374130.559199X3.953507XY1
2
2.874867X
4
对该模型做回归分析:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 13:08
24
Sample: 1981 2010 Included observations: 30
Variable C X1 X2 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient -88.37413 -0.559199 3.953507 Std. Error 50.79745 0.146245 1.271718 t-Statistic -1.739736 -3.823726 3.108794 Prob. 0.0937 0.0007 0.0045 0.985925 Mean dependent var 901.1217 0.984301 S.D. dependent var 153.2279 Akaike info criterion 610448.7 Schwarz criterion -191.3794 F-statistic 1.565398 Prob(F-statistic)
1222.936 13.02530 13.21212 607.0893 0.000000
得到DW=1.565398,落入不能确定的区间,所以认为存在自相关。 检验自相关:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8
存在异方差。
(一) 处理异方差。
建立新序列:1/e X1/e X2/e X4/e Y/e;名称分别为:C1 X11 X21 X41 Y1
步骤:genr e=abs(resid)
Ls y c x1 x2 x4 Genr c=1/e Genr y1=y1/e Genr x11=x1/e Genr x21=x2/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 13:50 Sample: 1981 2010 Included observations: 30
C1 X11 X21 X
R-squared
Adjusted R-squared S.E. of regression
-94.31147 -0.603440 4.133349 3.014882
8.608801 0.070563 0.577046 0.201977
-10.95524 -8.551794 7.162942 14.92683
0.0000 0.0000 0.0000 0.0000
0.997526 Mean dependent var 14.32651 0.997241 S.D. dependent var 1.055204 Akaike info criterion
26
20.08766 3.068912
Sum squared resid Log likelihood
检验自相关:
28.94986 Schwarz criterion -42.03368 Durbin-Watson stat
3.255738 1.019393
对新序列做回归的到,DW= 1.019393 ,存在自相关。 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(二),处理自相关。对新序列处理自相关:
对模型做广义一阶差分回归,得AR(1)= 0.486728,经差分后得到新序列,设为 C2 Y2 X12 X22 X42.
步骤:genr y2=y1-0.486728*y1(-1) 补数:genr y2=y1*(1-(0.486728)^2)^0.5 Genr c2=c1-0.486728*c1(-1) genr c2=c1*(1-(0.486728)^2)^0.5 Genr x12=x11-0.486728*x11(-1) genr x12=x11*(1-(0.486728)^2)^0.5 Genr x22=x21-0.486728*x21(-1) genr x22=x21*(1-(0.486728)^2)^0.5
27
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 14:35 Sample: 1981 2010 C2 X12 X22 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-95.96263 -0.641961 4.344785 9.799621 0.083437 0.695956 -9.792485 -7.693938 6.242905 0.0000 0.0000 0.0000 0.998206 Mean dependent var 7.582501 0.997999 S.D. dependent var 0.923034 Akaike info criterion 22.15178 Schwarz criterion -38.01896 Durbin-Watson stat
20.63315 2.801264 2.988091 1.465633
W 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
28
不存在异方差。
(三),处理自相关。
对模型做广义差分回归,得AR(1)= 0.249879,经差分后得到新序列,设为 C3 Y3 X13 X23 X43.
步骤:genr y3=y2-0.249879*y2(-1) 补数:genr y3=y2*(1-(0.249879)^2)^0.5 Genr c3=c2-0.249879*c2(-1) genr c3=c2*(1-(0.249879)^2)^0.5 Genr x13=x12-0.249879*x12(-1) genr x13=x12*(1-(0.249879)^2)^0.5 Genr x23=x22-0.249879*x22(-1) genr x23=x22*(1-(0.249879)^2)^0.5 Genr x43=x42-0.249879*x42(-1) genr x43=x42*(1-(0.249879)^2)^0.5
29
Dependent Variable: Y3 Method: Least Squares Date: 12/10/11 Time: 15:05 Sample: 1981 2010 Included observations: 30
C3 X13 X23 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-97.64386 -0.659705 4.461297 9.786806 0.088239 0.727071 -9.977092 -7.476370 6.135985 0.0000 0.0000 0.0000 0.998585 Mean dependent var 5.766056 0.998422 S.D. dependent var 0.896701 Akaike info criterion 20.90588 Schwarz criterion -37.15065 Durbin-Watson stat
22.57512 2.743377 2.930203 1.722198
对新序列做回归,得到DW=1.722198,1.65
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(四),处理异方差 建立新序列:c3/e1 X13/e1 X23/e1 X43/e1 Y3/e1;名称分别为:C4 X14 X24 X44 Y4
步骤::genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x23/e1 x43/e1 Genr y4=y3/e1
Genr c4=c3/e1 Genr x14=x13/e1 Genr x24=x23/e1
Dependent Variable: Y4 Method: Least Squares Date: 12/10/11 Time: 16:02 Sample: 1981 2010 Included observations: 30
C4 X14 X24 R-squared
Adjusted R-squared
-90.22602 -0.664113 4.570423 4.586292 0.020761 0.088358 -19.67298 -31.98820 51.72644 0.0000 0.0000 0.0000 0.999810 Mean dependent var 16.94523 0.999788 S.D. dependent var
31
67.59562
S.E. of regression Sum squared resid Log likelihood
0.984423 Akaike info criterion 25.19631 Schwarz criterion -39.95066 Durbin-Watson stat
2.930044 3.116870 1.082789
W检验异方差
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。 (五)处理自相关
对模型做广义差分回归,得AR(1)= 0.476737,经差分后得到新序列,设为 C5 Y5 X15 X25 X45.
步骤:genr y5=y4-0.476737*y4(-1) 补数:genr y5=y4*(1-(0.476737)^2)^0.5 Genr c5=c4-0.476737*c4(-1) genr c5=c4*(1-(0.476737)^2)^0.5 Genr x15=x14-0.476737*x14(-1) genr x15=x14*(1-(0.476737)^2)^0.5 Genr x25=x24-0.476737*x24(-1) genr x25=x24*(1-(0.476737)^2)^0.5
32
Dependent Variable: Y5 Method: Least Squares Date: 12/10/11 Time: 16:26 Sample: 1981 2010 Included observations: 30
C5 X15 X25 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-92.96739 -0.660557 4.530059 3.163998
3.583942 0.016396 0.069258 0.052907
-25.93998 -40.28701 65.40856 59.80344
0.0000 0.0000 0.0000 0.0000
0.999888 Mean dependent var 8.959543 0.999876 S.D. dependent var 0.873631 Akaike info criterion 19.84400 Schwarz criterion -36.36872 Durbin-Watson stat
78.30888 2.691248 2.878074 1.486589
经过回归的,dw= 1.486589,存在自相关。 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
33
不存在异方差。
(六),处理自相关。
对模型做广义差分回归,得AR(1)= 0.222243,经差分后得到新序列,设为 C6 Y6 X16 X26 X46.
步骤:genr y6=y5-0.222243*y5(-1) 补数:genr y6=y5*(1-(0.222243)^2)^0.5 Genr c6=c5-0.222243*c5(-1) genr c6=c5*(1-(0.222243)^2)^0.5 Genr x16=x15-0.222243*x15(-1) genr x16=x15*(1-(0.222243)^2)^0.5 Genr x26=x25-0.222243*x25(-1) genr x26=x25*(1-(0.222243)^2)^0.5
34
Dependent Variable: Y6 Method: Least Squares Date: 12/10/11 Time: 16:39 Sample: 1981 2010 Included observations: 30
C6 X16 X26 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-93.82215 -0.659863 4.518683 3.139959 0.014390 0.060551 -29.88006 -45.85417 74.62651 0.0000 0.0000 0.0000 0.999914 Mean dependent var 6.960680 0.999905 S.D. dependent var 0.854809 Akaike info criterion 18.99815 Schwarz criterion -35.71532 Durbin-Watson stat
87.52613 2.647688 2.834514 1.713623
W 所以不存在自相关。
检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。
F检验:R²=0.999914,F=( R²/k)/【(1- R²)/(n-k-1)】= 100766.5>2.98 = F 0.05,3,26 此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。
根据经验得出: 解释变量X1有GDP与被解释变量固定资本形成总额应该是正向的比例关系,二者不可能成反比关系,所以经济意义不合格,故舍弃该模型。
35
九, 选X1,X5为二元模型
根据上面的解释变量回归列表,这里我们选择(X1,X5)模型进行处理。 模型为:
ˆ-147.78510.397836X21.11890XY15
对序列做回归:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 17:11 Sample: 1981 2010 Included observations: 30
C X1 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -147.7851 0.397836 21.11890
63.87827 0.056010 5.312796
-2.313542 7.102942 3.975100
0.0285 0.0000 0.0005
0.965619 Mean dependent var 901.1217 0.963072 S.D. dependent var 235.0073 Akaike info criterion 1491168. Schwarz criterion -204.7763 F-statistic 1222.936 13.85175 13.99187 379.1565 得到DW=1.152500,落入不能确定的区间存在自相关 检验异方差
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(一)处理异方差
建立新序列:
ye
、
x1e
、
x5e
,名称分别为Y1、X11、X51。
步骤:Ls y c x1 x5 Genr x51=x5/e
36
Genr e=abs(resid) Genr c1=1/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 18:53 Sample: 1981 2010 Variable
Coefficient
Std. Error
37
t-Statistic Prob.
C1 X11 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-123.0106 0.407077 11.33368 0.014473 -10.85354 28.12660 0.0000 0.0000 0.994249 Mean dependent var 7.713442 0.993823 S.D. dependent var 0.952245 Akaike info criterion 24.48278 Schwarz criterion -39.51975 Durbin-Watson stat
12.11553 2.834650 2.974769 0.466343
对新序列做回归,得到,DW= 0.466343,落入不能确定的区间,所以认为存在自相关。
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差
(二)处理自相关
对模型做广义差分回归,得AR(1)= 0.803238,经差分后得到新序列,设为 C2 Y2 X12 X52
步骤:genr y2=y1-0.803238*y1(-1) 补数:genr y2=y1*(1-(0.803238)^2)^0.5 Genr c2=c1-0.803238*c1(-1) genr c2=c1*(1-(0.803238)^2)^0.5 Genr x12=x11-0.803238*x11(-1) genr x12=x11*(1-(0.803238)^2)^0.5 Genr x52=x51-0.803238*x51(-1) genr x52=x51*(1-(0.803238)^2)^0.5
38
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 19:13 Sample: 1981 2010 Included observations: 30
Variable C2 X12 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient -131.8904 0.415940 17.07040
Std. Error 7.440616 0.008575 1.608846
t-Statistic -17.72574 48.50612 10.61034
Prob. 0.0000 0.0000 0.0000
0.998468 Mean dependent var 1.752318 0.998354 S.D. dependent var 0.600207 Akaike info criterion 9.726709 Schwarz criterion -25.67333 Durbin-Watson stat
14.79481 1.911555 2.051675 1.491275
W关。
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。
39
将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。
(三)处理自相关
对模型做广义差分回归,得AR(1)= 0.210519,经差分后得到新序列,设为 C3 Y3 X13 X53
步骤:genr y3=y2- 0.210519*y2(-1) 补数:genr y3=y2*(1-(0.210519)^2)^0.5 Genr c3=c2-0.210519*c2(-1) genr c3=c2*(1-(0.210519)^2)^0.5 Genr x13=x12-0.210519*x12(-1) genr x13=x12*(1-(0.210519)^2)^0.5 Genr x53=x52-0.210519*x52(-1) genr x53=x52*(1-(0.210519)^2)^0.5
40
Dependent Variable: Y3 Method: Least Squares
Date: 12/10/11 Time: 19:34 Sample: 1981 2010 Variable C3 X13 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Coefficient -133.8034 0.415442 Std. Error 6.632269 0.007662 t-Statistic -20.17460 54.22261 Prob. 0.0000 0.0000 0.998817 Mean dependent var 1.277201 0.998729 S.D. dependent var 0.590396 Akaike info criterion 9.411322 Schwarz criterion 16.56218 1.878593 2.018713 对新序列做回归,得到DW=1.723499,1.57
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差
41
(四)处理异方差
建立新序列y3/e1,c3/e1 ,x13/e1, x53/e1,名称分别为Y4、X14、X54。 步骤:
Genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x53/e1 Genr y4=y3/e1 Genr c4=c3/e1 Genr x14=x13/e1
Dependent Variable: Y4 Method: Least Squares
42
Date: 12/10/11 Time: 19:54 Sample: 1981 2010 Variable C4 X14 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Coefficient -133.8279 0.412074 Std. Error 3.446791 0.005827 t-Statistic -38.82681 70.71761 Prob. 0.0000 0.0000 0.999878 Mean dependent var 23.03938 0.999869 S.D. dependent var 1.018596 Akaike info criterion 28.01354 Schwarz criterion 88.87106 2.969368 3.109487 对新序列做回归,得到DW= 0.954044,落入不能确定区域,所以认为存在自相关
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差
(五)处理自相关。
对模型做广义差分回归,得AR(1)= 0.606487,经差分后得到新序列,设为 C5 Y5 X15 X55
步骤:genr y5=y4- 0.606487*y4(-1) 补数:genr y5=y4*(1-(0.606487)^2)^0.5 Genr c5=c4-0.606487*c4(-1) genr c5=c4*(1-(0.606487)^2)^0.5 Genr x15=x14-0.606487*x14(-1) genr x15=x14*(1-(0.606487)^2)^0.5
43
九, 选X1,X5为二元模型
根据上面的解释变量回归列表,这里我们选择(X1,X5)模型进行处理。 模型为:
ˆ-147.78510.397836X21.11890XY15
对序列做回归:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 17:11 Sample: 1981 2010 Included observations: 30
C X1 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -147.7851 0.397836 21.11890
63.87827 0.056010 5.312796
-2.313542 7.102942 3.975100
0.0285 0.0000 0.0005
0.965619 Mean dependent var 901.1217 0.963072 S.D. dependent var 235.0073 Akaike info criterion 1491168. Schwarz criterion -204.7763 F-statistic 1222.936 13.85175 13.99187 379.1565 得到DW=1.152500,落入不能确定的区间存在自相关 检验异方差
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(一)处理异方差
建立新序列:
ye
、
x1e
、
x5e
,名称分别为Y1、X11、X51。
步骤:Ls y c x1 x5 Genr x51=x5/e
44
Genr e=abs(resid) Genr c1=1/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 18:53 Sample: 1981 2010 Variable
Coefficient
Std. Error
45
t-Statistic Prob.
模型方程:Yˆ118.52544.076322X21.118324X4
Dependent Variable: Y Method: Least Squares Date: 12/12/11 Time: 14:25 Sample: 1981 2010 Included observations: 30
Variable C X2 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient -118.5254 4.076322 1.118324
Std. Error 61.55143 1.559355 0.304985
t-Statistic -1.925632 2.614109 3.666816
Prob. 0.0647 0.0145 0.0011
0.978010 Mean dependent var 901.1217 0.976381 S.D. dependent var 187.9450 Akaike info criterion 953729.5 Schwarz criterion -198.0722 F-statistic 1.277882 Prob(F-statistic)
1222.936 13.40482 13.54493 600.4235 0.000000
对序列做回归得到dw=1.277882,落入不能确定的区间,所以存在自相关。 检验异方差:
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(一)处理异方差
建立新序列为,y/e,1/e,x2/e,x4/e,分别命名为,y1,c1,x21,x41
Genr e=abs(resid) Ls y/e 1/e x2/e x4/e Genr y1=y/e Genr c1=1/e
46
Genr x21=x2/e Genr x41=x4/e
Dependent Variable: Y1 Method: Least Squares Date: 12/12/11 Time: 14:48 Sample: 1981 2010 Included observations: 30
Variable C1 X21
Coefficient -77.89504 4.731235
Std. Error 11.94723 0.300503
47
t-Statistic -6.519925 15.74441
Prob. 0.0000 0.0000
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.998929 Mean dependent var 16.31470 0.998849 S.D. dependent var 0.875438 Akaike info criterion 20.69259 Schwarz criterion -36.99683 Durbin-Watson stat
25.80730 2.666455 2.806575 1.207917
对新序列做回归,得到DW=1.207917,落入不能确定的区间,所以认为存在自相关。 检验异方差:
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(二),处理自相关。
对模型做广义差分回归,得AR(1)= 0.684453,经差分后得到新序列,设为 C2 Y2 X22 X42
步骤:genr y2=y1- 0.684453*y1(-1) 补数:genr y2=y1*(1-(0.684453)^2)^0.5 Genr c2=c1-0.684453*c1(-1) genr c2=c1*(1-(0.684453)^2)^0.5 Genr x22=x21-0.684453*x21(-1) genr x22=x21*(1-(0.684453)^2)^0.5 Genr x42=x41-0.684453*x41(-1) genr x42=x41*(1-(0.684453)^2)^0.5
48
Dependent Variable: Y2 Method: Least Squares Date: 12/12/11 Time: 14:58 Sample: 1981 2010 Included observations: 30
C2 X22 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-103.3055 4.481023 15.79004 0.320482 -6.542445 13.98212 0.0000 0.0000 0.998790 Mean dependent var 5.316985 0.998700 S.D. dependent var 0.761781 Akaike info criterion 15.66839 Schwarz criterion -32.82487 Durbin-Watson stat
21.12765 2.388325 2.528445 1.760787
对新序列做回归,DW= 1.760787,1.57
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
49
不存在异方差。
F检验:R²=0.998790,F=( R²/k)/【(1- R²)/(n-k-1)】= 11143.52>3.35 = F 0.05,2,27
至此,该模型已不存在异方差和自相关,T检验和F检验均合格,不存在多重共线性.得到回归方程为: Yˆ-103.3.554.481023X21.063276X4
十一,经济意义、统计意义的解释
对各解释变量偏回归系数的解释
ˆ4.481023ˆ62 41.06327
a:统计意义:
在X2,不变的情况下,X4增加一个单位,Y平均增加1.063276个单位 在X4不变的情况下,X2增加一个单位,Y平均增加4.481023个单位 b:经济意义:
在进口额不变的情况下,社会消费品零售总额每增加1亿元人民币,云南省固定资本形成总额平均增加1.063276亿元人民币。
在社会消费品零售总额不变的情况下,进口额每增加1亿元人民币,云南省固定资本形成总额平均增加4.481023亿元人民币。
十二、相关系数、大β系数、弹性系数
②偏相关系数 X2X4Y
rYX2X4
rYX
2
rYXrX
4
2
X4
2
rYX4
2
0.[1**********]70.[1**********]1*0.[1**********]3
0.[1**********]10.[1**********]3
2
2
0.44941
rX2X4
50
《计量经济学》分析报告
关于云南省固定资本形成总额
影响因素的计量分析
指导老师:沈鸣 班级:市调0901 姓名:陈妍琦
学号:2009161676
一、前言
在科技统计分析中,经常需要对与科技进步相关的经济发展质量进行反映,因而常常要面临有关资本指标的选择,其中有两个十分相似的指标,即资本形成和固定资本形成。
其实这个问题对大多数人来说并不是很困难,把握住核心的一点,即资本形成总额包括固定资本形成总额与存货增加就可以了。
本文旨在研究云南省的固定资本形成总额,固定资本形成总额可分为有形固定资本形成总额和无形固定资本形成总额。有形固定资本形成总额包括一定时期内完成的建筑工程、安装工程和设备工器 具购置(减处置)价值,以及土地改良、新增役、种、奶、毛、娱乐用牲畜和新增经济林木 价值。无形固定资本形成总额包括矿藏的勘探、计算机软件、娱乐和文学艺术品原件等获得减处置。
固定资本形成都是生产总值统计中的主要指标。它指的是以货币形式表现的、在一定时期内建造和购置固定资产的工作量以及与此有关费用的总称。固定资产投资统计中的指标,有分月和分季度的数据;固定资产投资额存在着重复统计,比如上一期留存下来的固定资产被其他生产单位在计算期购买或租赁而产生的费用,固定资本形成中则扣除了由于出售、易货交易和实物资本转移而转出的价值;在统计口径上,固定资产投资自1997年起,统计起点已由5万元提高到了50万元;固定资本形成中还包含部分无形资产的净增加额。
本文通过选择固定资本形成总额来观察云南省经济发展,希望可以起到一个概括性的作用。
一、 理论背景
云南省是一个内地省市,没有与其相连接的海域,且处于横断山脉的地理位置,造就了它的交通个方面的限制,与中国南部和中原地区的省市相比较,农作物的发展不如中原地区的鱼米之乡,相对偏远的地理位置对外商投资也有一定影响。
中华人民共和国成立以来,特别是改革开发以来,云南省的国民经济和各项社会事业进入了快速发展的时期。云南全省面貌发生了深刻变化,经济实力明显增强。云南经济发展迅速,提前二年实现人均1000美元的阶段性目标,以能源、通讯、交通为重点的基础设施不断改善,工业化进程明显加快。10多年来,云南经济保持了较快的增长速度,国内生产总值在全国的排序,由1980年的第22位,上升至1999年的第18位,以能源、通讯、交通为重点的基础设施不断改善,工业化进程明显加快。产业结构逐步得到调整,一批新的支柱产业正在兴起。农业的基础地位不断增强,农业经济持续发展,粮食生产连续获得丰收,1999年粮食产量达1300万吨。
云南省气候和地理位置的缘故,适合种植很多经济林木,期间可以饲养多种家禽,随着经济的发展,大片的土地得到了开发与利用。固定资本形成总额也呈上升的发展趋势,一切发展都呈现较好的趋势。影响固定资本形成总额的因素很多很多,在这里我们只几个主要的因素来讨论。固定资本形成总额与GDP,进口额,固定资产投资额,社会消费品零售总额,外商直接投资额等都有关系,在下文中主要就是对这几个因素进行了分析。
二、 模型的选择与建立
选取了以下五个解释变量,来考察对固定资本形成总额的影响:
Y:云南省固定资本形成总额,单位,亿元。 X1:云南省GDP,单位:亿元。 X2:云南省进口额,单位:亿元。
X3:云南省固定资产投资额,单位:亿元。 X4:云南省社会消费零售总额,单位:亿元。 X5:云南省外商直接投资额:单位:亿元。
Y = β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5 + μ
一共有5个解释变量;β0为常数项;μ为随机误差项,描述变量外的因素
对模型的干扰。
四、数据来源与分析
1.原始数据
时间序列的变量及原始数据:由于解释变量和被解释变量中都是以“亿元”作单位,数据的口径均同质可比,没有实物量指标,故可用现价数据,而不用调整为可比价
2,在解释变量之间一一做散点图。
由散点图可看出,被解释变量Y与解释变量X1、X2、X3、X4、X5之间基本存在着线性关系,所以初步估计我所要建立的模型是直线模型。
6000
6000
40004000
Y
Y
2000
2000
00
2000
4000X1
6000
8000
00
100
200
X2
300
400
500
固定资本形成总额与GDP的关系 固定资本形成总额与进口额的关系
6000
6000
4000
4000
Y
2000
Y
2000
00
2000
X3
4000
6000
00
500
[***********]00
X4
固定资本形成总额与固定资产投资额的关系 固定资本形成总额与社会消费 品零售额的关系
Y
00
20
40
X5
60
80
100
固定资本形成总额与外商直接投资额
基本统计量
协方差
简单相关系数
五、模型估计
模型的初步估计与检验
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+μ
模型的回归分析
的T检验;R2表示该模型的可决系数;F表示对应的模型整体的F检验值,若出现*号则表明通过了显著性水平为0.05的F检验;若是偏回归系数和方程整体都通过了各自的假设检验,则“合格”一栏中注上“合”,若有任一项没有通过检验,则该栏注上“不”。
六、五元模型的检验
ˆ99.403620.674870x14.571649x20.056894x33.348834x43.532978x5回归方程:y
Dependent Variable: Y Method: Least Squares Date: 12/03/11 Time: 14:50 Sample: 1981 2010 Included observations: 30
C X1 X2 X3 X4 X5
R-squared
-99.40362 -0.674870 4.571649 -0.056894 3.348834 -3.532978
75.63059 0.364239 2.961426 0.421120 1.551115 5.489547
-1.314331 -1.852821 1.543732 -0.135102 2.158986 -0.643583
0.2012 0.0762 0.1357 0.8937 0.0411 0.5259
0.986175 Mean dependent var 901.1217
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.983295 S.D. dependent var 158.0640 Akaike info criterion 599621.8 Schwarz criterion -191.1110 F-statistic 1.560280 Prob(F-statistic)
1222.936 13.14073 13.42097 342.3919 0.000000
DW检验值是1.07
将Xi按升序排列,i=1,2,3,4,5;删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
分别用两个子样本做回归。求出大e和小e,并做F检验。
2
2
(一)处理自相关
对模型做广义一阶差分回归,得AR(1)= 0.372682,经差分后得到新序列,设为C1、Y1、X11、X21、X31、X41、X51、 生成新数据:
C1=1- 0.372682 补第一个数c1= (1-0.372682^2)^0.5 Y1=y-y (-1)* 0.372682 y1=y*(1-0.372682^2)^0.5 x11=x1-x1 (-1)* 0.372682 x11=x1*(1-0.372682^2)^0.5 x21=x2-x2(-1)* 0.372682 x21=x2*(1-0.372682^2)^0.5 x31=x3-x3(-1)* 0.372682 x31=x3*(1-0.372682^2)^0.5 x41=x4-x4(-1)* 0.372682 x41=x4*(1-0.372682^2)^0.5 x51=x5-x5(-1)* 0.372682 x51=x5*(1-0.372682^2)^0.5
Dependent Variable: Y1 Method: Least Squares Date: 12/05/11 Time: 14:20 Sample: 1981 2010 Included observations: 30
C1 X11 X21 X31 X41 X51
R-squared
Adjusted R-squared S.E. of regression Sum squared resid
-128.3329 -1.044183 7.741286 -0.411536 4.670127 -2.689317
107.8559 0.423228 3.366889 0.499486 1.836924 6.659050
-1.189855 -2.467190 2.299240 -0.823919 2.542362 -0.403859
0.2457 0.0211 0.0305 0.4181 0.0179 0.6899
0.974779 Mean dependent var 629.9881 0.969524 S.D. dependent var 154.6371 Akaike info criterion 573903.1 Schwarz criterion
885.8026 13.09690 13.37714
DW检验值是1.07
对新序列进行异方差检验
将Xi按升序排列,i=1,2,3,4,5;删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
分别用两个子样本做回归。求出大e和小e,并做F检验。 结果如下 :
2
2
(二)处理异方差
建立新序列:X32、X42、X52。
y1e
、
x11e
、
x21
e
、
x31e
、
x41e
、
x51e
,名称分别为Y2、X12、X22、
Genr e=abs(resid)
Ls y1/e c1/e x11/e x21/e x31/e x41/e x51/e Genr y2=y1/e Genr c2=c1/e Genr x12=x11/e Genr x22=x21/e Genr x32=x31/e Genr x42=x41/e Genr x52=x51/e
Dependent Variable: Y2 Method: Least Squares Date: 12/06/11 Time: 19:03 Sample: 1981 2010 Included observations: 30
C2 X12 X22 X32 X42 X52
-25.45045 -0.330301 1.262406 0.372116 2.148021 -5.964718
6.360935 0.031788 0.343434 0.050177 0.166206 1.216551
-4.001055 -10.39065 3.675837 7.416049 12.92382 -4.902976
11
0.0005 0.0000 0.0012 0.0000 0.0000 0.0001
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.999876 Mean dependent var 0.999850 S.D. dependent var 0.995524 Akaike info criterion 23.78563 Schwarz criterion -39.08642 Durbin-Watson stat
31.71469 81.37620 3.005761 3.286001 1.063735
检验子相关:
对新序列作回归分析,DW=1.063735,1.063735
(三)处理自相关
对模型做广义一阶差分回归,得AR(1)=0.689860,经差分后得到新序列 生成新数据:
C3=c2-c2(-1)* 0.689860 补第一个数:c3=c2*(1-0.689860^2)^0.5 Y3=y2-y2(-1)* 0.689860 y3=y2*(1-0.689860^2)^0.5 x13=x12-x12(-1)* 0.689860 x13=x12*(1-0.689860^2)^0.5 x23=x22-x22(-1)* 0.689860 x23=x22*(1-0.689860^2)^0.5 x33=x32-x32(-1)* 0.689860 x33=x32*(1-0.689860^2)^0.5 x43=x42-x42(-1)* 0.689860 x43=x42*(1-0.689860^2)^0.5 x53=x52-x52(-1)* 0.689860 x53=x52*(1-0.689860^2)^0.5
12
Dependent Variable: Y3 Method: Least Squares Date: 12/06/11 Time: 19:38 Sample: 1981 2010 Variable C3 X13 X23 X33 X43 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient 0.391886 -0.279838 1.227121 0.477512 1.650686 Std. Error 2.727082 0.033210 0.317253 0.040615 0.113147 t-Statistic 0.143702 -8.426241 3.867956 11.75710 14.58891 Prob. 0.8869 0.0000 0.0007 0.0000 0.0000 0.999936 Mean dependent var 10.04425 0.999922 S.D. dependent var 0.896565 Akaike info criterion 19.29189 Schwarz criterion -35.94546 Durbin-Watson stat
101.6979 2.796364 3.076604 1.436711
对新序列作回归分析,DW=1.436711,1.07
对新序列进行异方差的检验
13
(四) 处理异方差
建立新序列:y3/e1,c3/e1,x13/e1,x23/e1,x33/e1,x43/e1,x53/e1,名称分别为Y4, C4, X14, X24, X34, X44, X54.
Ls y3 c3 x13 x23 x33 x43 x53
Genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x23/e1 x33/e1 x43/e1 x53/e1 Genr y4=y3/e Genr c4=c3/e Genr x14=x13/e Genr x24=x23/e Genr x34=x33/e Genr x44=x43/e Genr x54=x53/e
14
Dependent Variable: Y4 Method: Least Squares Date: 12/06/11 Time: 21:21 Sample: 1981 2010 Included observations: 30
C4 X14 X24 X34 X44 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.144855 -0.278665 1.213997 0.483026 1.634462 -5.178781
0.296577 0.003018 0.030110 0.011597 0.026542 0.193573
0.488422 -92.34014 40.31842 41.65160 61.57945 -26.75358
0.6297 0.0000 0.0000 0.0000 0.0000 0.0000
0.999997 Mean dependent var 154.5967 0.999997 S.D. dependent var 1.067073 Akaike info criterion 27.32748 Schwarz criterion -41.16859 Durbin-Watson stat
604.8441 3.144572 3.424812 1.835773
对新序列作回归分析,DW=1.835773, du
将Xi按升序排列,i=1,2,3,4,5:;删掉中间的8个,将其余样本点划分为样本容量为11个的两个子样本。分别用两个子样本做回归,求出大e和小e,并做F检验。
2
2
15
F检验:R²=0.999997,F=( R²/k)/【(1- R²)/(n-k-1)】= >2.60 = F 0.05,5,25 至此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。但该模型的可决系数和调整可决系数均为1,表现出完全的线性关系,说明拟合程度高达100%,Y完全是由系统因素影响,不包含随机因素影响,模型不含误差项。而计量经济学模型一定含有误差项,故此,舍弃此模型。 得出的回归方程为: =0.144855-0.278665X1+1.213997X2+0.483026X3+1.634462X4-5.178781X5 解释变量X1和X5分别是GDP和外商直接投资额,在一般情况下,外商要不投资,要不不投资,是不会为负的,而GDP在一般情况下是会随着固定资本形成总额的增长而增长的,可是现在的回归方程告诉我们的是二者是相反的关系,这是不正常的,鉴于X1和X5的经济意义不合格,所以,舍弃五元模型
七,选四元模型X1,X2,X4,X5为解释变量
(一)回归方程:=-92.0768-0.632825X1+4.217241X2+3.161763X4-3.53677X5 因为可选模型列表中四元模型没有合格的,所以我们只能选取一个t、F检验最多的,故选取了此模型。
Dependent Variable: Y Method: Least Squares Date: 12/07/11 Time: 14:42 Sample: 1981 2010
C X1 X2 X4 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid
-92.07676 -0.632825 4.217241 3.161763 -3.536772
51.66947 0.185502 1.346983 0.685164 5.380610
-1.782034 -3.411416 3.130878 4.614607 -0.657318
0.0869 0.0022 0.0044 0.0001 0.5170
0.986164 Mean dependent var 901.1217 0.983951 S.D. dependent var 154.9294 Akaike info criterion 600077.8 Schwarz criterion
16
1222.936 13.07483 13.30836
Log likelihood Durbin-Watson stat
-191.1224 F-statistic 1.577758 Prob(F-statistic)
445.4792 0.000000
Dw=1.577758,因为1.14
将Xi按升序排列,i=1,2,4,5:;删掉中间的8个,将其余样本点划分为样本容量为11个的两个子样本。分别用两个子样本做回归,求出大e和小
2
e,并做F检验。
所以存在异方差
2
(二)处理异方差
建立新序列:
ye
、
x1e
、
x2e
、
x4e
、
x5e
,名称分别为Y1、X11、X21、X41、X51。
步骤:Ls y c x1 x2 x4 x5
Genr e=abs(resid) Genr y1=y/e Genr x11=x1/e Genr x21=x2/e Genr x41=x4/e Genr x51=x5/e
Dependent Variable: Y1 Method: Least Squares Date: 12/07/11 Time: 18:38 Sample: 1981 2010 Included observations: 30
Variable C1 X11 X21 X41 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient -49.94615 -0.522995 5.836265 2.510949 Std. Error 13.33871 0.087154 0.370207 0.288556 t-Statistic -3.744451 -6.000788 15.76489 8.701763 Prob. 0.0010 0.0000 0.0000 0.0000 0.997422 Mean dependent var 10.70524 0.997010 S.D. dependent var 0.736026 Akaike info criterion 13.54335 Schwarz criterion -30.63863 Durbin-Watson stat
13.46009 2.375909 2.609442 1.157854
自相关检验
Dw=1.157854,因为1.14
18
(三)处理自相关
对模型作广义差分回归,得到AR(1)= 0.794702,经差分后得到的新序列设为Y2 、X12 、X22 、X42 、X52
步骤:ls y1 c1 x11 x21 x41 x51 ar(1),得出ar(1)
Genr c2=c1-0.794702*c1(-1) 补数:genr c2=c1*(1-(0.794702)^2)^0.5 Genr y2=y1-0.794702*y1(-1) genr y2=y1*(1-(0.794702)^2)^0.5
Genr x12=x11-0.794702*x11(-1) genr x12=x11*(1-(0.794702)^2)^0.5 Genr x22=x21-0.794702*x21(-1) genr x22=x21*(1-(0.794702)^2)^0.5 Genr x42=x41-0.794702*x41(-1) genr x42=x41*(1-(0.794702)^2)^0.5 Genr x
=x-0.794702*x(-1) genr x=x*(1-(0.794702)^2)^0.5 19
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 11:42 Sample: 1981 2010 Included observations: 30
Variable C2 X12 X22
X42
Coefficient 0.083271 -0.637676 6.529361
2.701595
Std. Error 0.617952 0.128355 0.288388
0.421879
t-Statistic
0.134753 -4.968069 22.64090
6.403715
Prob. 0.8939 0.0000 0.0000
0.0000
X52
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-3.489938 1.514624 -2.304162 0.0298
0.998124 Mean dependent var 2.524238 0.997823 S.D. dependent var 0.633165 Akaike info criterion 10.02246 Schwarz criterion -26.12262 Durbin-Watson stat
13.57110 2.074841 2.308374 1.340395
对新序列做回归,得到DW=1.340395,DL
对其做异方差检验;
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
20
所以该序列存在异方差。 (四)处理异方差。
步骤:ls y2 c2 x12 x22 x42 x52, 产生新的新序列为:y3,c3,x13,x23,x43,x53 Genr e1=abs(resid) ls y2 c2 x12 x22 x42 x52, genr y3=y2/e1 genr x13=x12/e1 genr x23=x22/e1 genr x43=x42/e1 genr x53=x52/e1
21
Dependent Variable: Y3 Method: Least Squares Date: 12/10/11 Time: 12:10 Sample: 1981 2010 Included observations: 30
C3 X13 X23 X43 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-0.322984 -0.643542 6.658485 2.707576 0.184490 0.053605 0.165738 0.168476 -1.750689 -12.00526 40.17488 16.07103 0.0923 0.0000 0.0000 0.0000 0.999996 Mean dependent var 94.09417 0.999995 S.D. dependent var 0.971333 Akaike info criterion 23.58719 Schwarz criterion -38.96075 Durbin-Watson stat
457.0434 2.930717 3.164250 1.520684
对新序列做回归,得到DW=1.520684.落入不能确定的区间,所以认为存在自相关。
对该序列做异方差检验:
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(五)处理自相关
对模型作广义差分回归,得到AR(1)= 0.360707,经差分后得到的新序列设为Y2 、X14 、X24 、X44、X54
步骤:ls y3 c3 x13 x23 x43 x53 ar(1),得出ar(1)
Genr c4=c3-0.3607070*c3(-1) 补数:genr c4=c3*(1-(0.360707)^2)^0.5 Genr y4=y3-0.360707*y3(-1) genr y4=y3*(1-(0.360707)^2)^0.5 Genr x14=x13-0.360707*x13(-1) genr x14=x13*(1-(0.360707)^2)^0.5
22
Genr x24=x23-0.360707*x23(-1) genr x24=x23*(1-0.360707)^2)^0.5 Genr x44=x43-0.360707*x43(-1) genr x44=x43*(1-(0.360707)^2)^0.5
Dependent Variable: Y4 Method: Least Squares Date: 12/10/11 Time: 12:41 Sample: 1981 2010 C4 X14
-0.163418 -0.630842
0.215601 0.050277
23
-0.757963 -12.54735
0.4556 0.0000
X24 X44 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
6.575481 2.671679 0.163660 0.157460 40.17777 16.96737 0.0000 0.0000 0.999997 Mean dependent var 60.18308 0.999996 S.D. dependent var 0.935359 Akaike info criterion 21.87241 Schwarz criterion -37.82858 Durbin-Watson stat
493.4388 2.855239 3.088772 1.932591
对新序列做回归,得到DW=1.932591。1.74
将Xi按升序排列,i=1,2,4,5,删掉排在中间的n/4个,即30/4,个,删掉8
F检验:R²=0.999997,
F=( R²/k)/【(1- R²)/(n-k-1)】= 2083327>2.74 = F 0.05,4,25
至此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。
根据经验得出: 解释变量X1有GDP与被解释变量固定资本形成总额应该是正向的比例关系,即解释变量X5外商直接投资额增大,被解释变量固定资本形成总额也增大,所以经济意义不合格,故舍弃该模型。
八,选三元模型X1,X2,X4
根据上面的解释变量回归列表,我们可知所有的三元模型的组合中,只有变量X1,X2,X4合格,所以选择其为模型进行处理。 模型为:
ˆ-88.374130.559199X3.953507XY1
2
2.874867X
4
对该模型做回归分析:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 13:08
24
Sample: 1981 2010 Included observations: 30
Variable C X1 X2 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient -88.37413 -0.559199 3.953507 Std. Error 50.79745 0.146245 1.271718 t-Statistic -1.739736 -3.823726 3.108794 Prob. 0.0937 0.0007 0.0045 0.985925 Mean dependent var 901.1217 0.984301 S.D. dependent var 153.2279 Akaike info criterion 610448.7 Schwarz criterion -191.3794 F-statistic 1.565398 Prob(F-statistic)
1222.936 13.02530 13.21212 607.0893 0.000000
得到DW=1.565398,落入不能确定的区间,所以认为存在自相关。 检验自相关:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8
存在异方差。
(一) 处理异方差。
建立新序列:1/e X1/e X2/e X4/e Y/e;名称分别为:C1 X11 X21 X41 Y1
步骤:genr e=abs(resid)
Ls y c x1 x2 x4 Genr c=1/e Genr y1=y1/e Genr x11=x1/e Genr x21=x2/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 13:50 Sample: 1981 2010 Included observations: 30
C1 X11 X21 X
R-squared
Adjusted R-squared S.E. of regression
-94.31147 -0.603440 4.133349 3.014882
8.608801 0.070563 0.577046 0.201977
-10.95524 -8.551794 7.162942 14.92683
0.0000 0.0000 0.0000 0.0000
0.997526 Mean dependent var 14.32651 0.997241 S.D. dependent var 1.055204 Akaike info criterion
26
20.08766 3.068912
Sum squared resid Log likelihood
检验自相关:
28.94986 Schwarz criterion -42.03368 Durbin-Watson stat
3.255738 1.019393
对新序列做回归的到,DW= 1.019393 ,存在自相关。 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(二),处理自相关。对新序列处理自相关:
对模型做广义一阶差分回归,得AR(1)= 0.486728,经差分后得到新序列,设为 C2 Y2 X12 X22 X42.
步骤:genr y2=y1-0.486728*y1(-1) 补数:genr y2=y1*(1-(0.486728)^2)^0.5 Genr c2=c1-0.486728*c1(-1) genr c2=c1*(1-(0.486728)^2)^0.5 Genr x12=x11-0.486728*x11(-1) genr x12=x11*(1-(0.486728)^2)^0.5 Genr x22=x21-0.486728*x21(-1) genr x22=x21*(1-(0.486728)^2)^0.5
27
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 14:35 Sample: 1981 2010 C2 X12 X22 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-95.96263 -0.641961 4.344785 9.799621 0.083437 0.695956 -9.792485 -7.693938 6.242905 0.0000 0.0000 0.0000 0.998206 Mean dependent var 7.582501 0.997999 S.D. dependent var 0.923034 Akaike info criterion 22.15178 Schwarz criterion -38.01896 Durbin-Watson stat
20.63315 2.801264 2.988091 1.465633
W 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,个,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
28
不存在异方差。
(三),处理自相关。
对模型做广义差分回归,得AR(1)= 0.249879,经差分后得到新序列,设为 C3 Y3 X13 X23 X43.
步骤:genr y3=y2-0.249879*y2(-1) 补数:genr y3=y2*(1-(0.249879)^2)^0.5 Genr c3=c2-0.249879*c2(-1) genr c3=c2*(1-(0.249879)^2)^0.5 Genr x13=x12-0.249879*x12(-1) genr x13=x12*(1-(0.249879)^2)^0.5 Genr x23=x22-0.249879*x22(-1) genr x23=x22*(1-(0.249879)^2)^0.5 Genr x43=x42-0.249879*x42(-1) genr x43=x42*(1-(0.249879)^2)^0.5
29
Dependent Variable: Y3 Method: Least Squares Date: 12/10/11 Time: 15:05 Sample: 1981 2010 Included observations: 30
C3 X13 X23 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-97.64386 -0.659705 4.461297 9.786806 0.088239 0.727071 -9.977092 -7.476370 6.135985 0.0000 0.0000 0.0000 0.998585 Mean dependent var 5.766056 0.998422 S.D. dependent var 0.896701 Akaike info criterion 20.90588 Schwarz criterion -37.15065 Durbin-Watson stat
22.57512 2.743377 2.930203 1.722198
对新序列做回归,得到DW=1.722198,1.65
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(四),处理异方差 建立新序列:c3/e1 X13/e1 X23/e1 X43/e1 Y3/e1;名称分别为:C4 X14 X24 X44 Y4
步骤::genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x23/e1 x43/e1 Genr y4=y3/e1
Genr c4=c3/e1 Genr x14=x13/e1 Genr x24=x23/e1
Dependent Variable: Y4 Method: Least Squares Date: 12/10/11 Time: 16:02 Sample: 1981 2010 Included observations: 30
C4 X14 X24 R-squared
Adjusted R-squared
-90.22602 -0.664113 4.570423 4.586292 0.020761 0.088358 -19.67298 -31.98820 51.72644 0.0000 0.0000 0.0000 0.999810 Mean dependent var 16.94523 0.999788 S.D. dependent var
31
67.59562
S.E. of regression Sum squared resid Log likelihood
0.984423 Akaike info criterion 25.19631 Schwarz criterion -39.95066 Durbin-Watson stat
2.930044 3.116870 1.082789
W检验异方差
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。 (五)处理自相关
对模型做广义差分回归,得AR(1)= 0.476737,经差分后得到新序列,设为 C5 Y5 X15 X25 X45.
步骤:genr y5=y4-0.476737*y4(-1) 补数:genr y5=y4*(1-(0.476737)^2)^0.5 Genr c5=c4-0.476737*c4(-1) genr c5=c4*(1-(0.476737)^2)^0.5 Genr x15=x14-0.476737*x14(-1) genr x15=x14*(1-(0.476737)^2)^0.5 Genr x25=x24-0.476737*x24(-1) genr x25=x24*(1-(0.476737)^2)^0.5
32
Dependent Variable: Y5 Method: Least Squares Date: 12/10/11 Time: 16:26 Sample: 1981 2010 Included observations: 30
C5 X15 X25 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-92.96739 -0.660557 4.530059 3.163998
3.583942 0.016396 0.069258 0.052907
-25.93998 -40.28701 65.40856 59.80344
0.0000 0.0000 0.0000 0.0000
0.999888 Mean dependent var 8.959543 0.999876 S.D. dependent var 0.873631 Akaike info criterion 19.84400 Schwarz criterion -36.36872 Durbin-Watson stat
78.30888 2.691248 2.878074 1.486589
经过回归的,dw= 1.486589,存在自相关。 检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
33
不存在异方差。
(六),处理自相关。
对模型做广义差分回归,得AR(1)= 0.222243,经差分后得到新序列,设为 C6 Y6 X16 X26 X46.
步骤:genr y6=y5-0.222243*y5(-1) 补数:genr y6=y5*(1-(0.222243)^2)^0.5 Genr c6=c5-0.222243*c5(-1) genr c6=c5*(1-(0.222243)^2)^0.5 Genr x16=x15-0.222243*x15(-1) genr x16=x15*(1-(0.222243)^2)^0.5 Genr x26=x25-0.222243*x25(-1) genr x26=x25*(1-(0.222243)^2)^0.5
34
Dependent Variable: Y6 Method: Least Squares Date: 12/10/11 Time: 16:39 Sample: 1981 2010 Included observations: 30
C6 X16 X26 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-93.82215 -0.659863 4.518683 3.139959 0.014390 0.060551 -29.88006 -45.85417 74.62651 0.0000 0.0000 0.0000 0.999914 Mean dependent var 6.960680 0.999905 S.D. dependent var 0.854809 Akaike info criterion 18.99815 Schwarz criterion -35.71532 Durbin-Watson stat
87.52613 2.647688 2.834514 1.713623
W 所以不存在自相关。
检验异方差:
将Xi按升序排列,i=1,2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。
F检验:R²=0.999914,F=( R²/k)/【(1- R²)/(n-k-1)】= 100766.5>2.98 = F 0.05,3,26 此,该模型已不存在自相关和异方差,且F、t检验在95%的置信概率下均通过,所以我们认为不存在多重共线性。
根据经验得出: 解释变量X1有GDP与被解释变量固定资本形成总额应该是正向的比例关系,二者不可能成反比关系,所以经济意义不合格,故舍弃该模型。
35
九, 选X1,X5为二元模型
根据上面的解释变量回归列表,这里我们选择(X1,X5)模型进行处理。 模型为:
ˆ-147.78510.397836X21.11890XY15
对序列做回归:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 17:11 Sample: 1981 2010 Included observations: 30
C X1 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -147.7851 0.397836 21.11890
63.87827 0.056010 5.312796
-2.313542 7.102942 3.975100
0.0285 0.0000 0.0005
0.965619 Mean dependent var 901.1217 0.963072 S.D. dependent var 235.0073 Akaike info criterion 1491168. Schwarz criterion -204.7763 F-statistic 1222.936 13.85175 13.99187 379.1565 得到DW=1.152500,落入不能确定的区间存在自相关 检验异方差
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(一)处理异方差
建立新序列:
ye
、
x1e
、
x5e
,名称分别为Y1、X11、X51。
步骤:Ls y c x1 x5 Genr x51=x5/e
36
Genr e=abs(resid) Genr c1=1/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 18:53 Sample: 1981 2010 Variable
Coefficient
Std. Error
37
t-Statistic Prob.
C1 X11 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-123.0106 0.407077 11.33368 0.014473 -10.85354 28.12660 0.0000 0.0000 0.994249 Mean dependent var 7.713442 0.993823 S.D. dependent var 0.952245 Akaike info criterion 24.48278 Schwarz criterion -39.51975 Durbin-Watson stat
12.11553 2.834650 2.974769 0.466343
对新序列做回归,得到,DW= 0.466343,落入不能确定的区间,所以认为存在自相关。
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差
(二)处理自相关
对模型做广义差分回归,得AR(1)= 0.803238,经差分后得到新序列,设为 C2 Y2 X12 X52
步骤:genr y2=y1-0.803238*y1(-1) 补数:genr y2=y1*(1-(0.803238)^2)^0.5 Genr c2=c1-0.803238*c1(-1) genr c2=c1*(1-(0.803238)^2)^0.5 Genr x12=x11-0.803238*x11(-1) genr x12=x11*(1-(0.803238)^2)^0.5 Genr x52=x51-0.803238*x51(-1) genr x52=x51*(1-(0.803238)^2)^0.5
38
Dependent Variable: Y2 Method: Least Squares Date: 12/10/11 Time: 19:13 Sample: 1981 2010 Included observations: 30
Variable C2 X12 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Coefficient -131.8904 0.415940 17.07040
Std. Error 7.440616 0.008575 1.608846
t-Statistic -17.72574 48.50612 10.61034
Prob. 0.0000 0.0000 0.0000
0.998468 Mean dependent var 1.752318 0.998354 S.D. dependent var 0.600207 Akaike info criterion 9.726709 Schwarz criterion -25.67333 Durbin-Watson stat
14.79481 1.911555 2.051675 1.491275
W关。
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。
39
将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差。
(三)处理自相关
对模型做广义差分回归,得AR(1)= 0.210519,经差分后得到新序列,设为 C3 Y3 X13 X53
步骤:genr y3=y2- 0.210519*y2(-1) 补数:genr y3=y2*(1-(0.210519)^2)^0.5 Genr c3=c2-0.210519*c2(-1) genr c3=c2*(1-(0.210519)^2)^0.5 Genr x13=x12-0.210519*x12(-1) genr x13=x12*(1-(0.210519)^2)^0.5 Genr x53=x52-0.210519*x52(-1) genr x53=x52*(1-(0.210519)^2)^0.5
40
Dependent Variable: Y3 Method: Least Squares
Date: 12/10/11 Time: 19:34 Sample: 1981 2010 Variable C3 X13 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Coefficient -133.8034 0.415442 Std. Error 6.632269 0.007662 t-Statistic -20.17460 54.22261 Prob. 0.0000 0.0000 0.998817 Mean dependent var 1.277201 0.998729 S.D. dependent var 0.590396 Akaike info criterion 9.411322 Schwarz criterion 16.56218 1.878593 2.018713 对新序列做回归,得到DW=1.723499,1.57
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差
41
(四)处理异方差
建立新序列y3/e1,c3/e1 ,x13/e1, x53/e1,名称分别为Y4、X14、X54。 步骤:
Genr e1=abs(resid)
Ls y3/e1 c3/e1 x13/e1 x53/e1 Genr y4=y3/e1 Genr c4=c3/e1 Genr x14=x13/e1
Dependent Variable: Y4 Method: Least Squares
42
Date: 12/10/11 Time: 19:54 Sample: 1981 2010 Variable C4 X14 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Coefficient -133.8279 0.412074 Std. Error 3.446791 0.005827 t-Statistic -38.82681 70.71761 Prob. 0.0000 0.0000 0.999878 Mean dependent var 23.03938 0.999869 S.D. dependent var 1.018596 Akaike info criterion 28.01354 Schwarz criterion 88.87106 2.969368 3.109487 对新序列做回归,得到DW= 0.954044,落入不能确定区域,所以认为存在自相关
检验异方差:
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
不存在异方差
(五)处理自相关。
对模型做广义差分回归,得AR(1)= 0.606487,经差分后得到新序列,设为 C5 Y5 X15 X55
步骤:genr y5=y4- 0.606487*y4(-1) 补数:genr y5=y4*(1-(0.606487)^2)^0.5 Genr c5=c4-0.606487*c4(-1) genr c5=c4*(1-(0.606487)^2)^0.5 Genr x15=x14-0.606487*x14(-1) genr x15=x14*(1-(0.606487)^2)^0.5
43
九, 选X1,X5为二元模型
根据上面的解释变量回归列表,这里我们选择(X1,X5)模型进行处理。 模型为:
ˆ-147.78510.397836X21.11890XY15
对序列做回归:
Dependent Variable: Y Method: Least Squares Date: 12/10/11 Time: 17:11 Sample: 1981 2010 Included observations: 30
C X1 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -147.7851 0.397836 21.11890
63.87827 0.056010 5.312796
-2.313542 7.102942 3.975100
0.0285 0.0000 0.0005
0.965619 Mean dependent var 901.1217 0.963072 S.D. dependent var 235.0073 Akaike info criterion 1491168. Schwarz criterion -204.7763 F-statistic 1222.936 13.85175 13.99187 379.1565 得到DW=1.152500,落入不能确定的区间存在自相关 检验异方差
将Xi按升序排列,i=1,5,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
(一)处理异方差
建立新序列:
ye
、
x1e
、
x5e
,名称分别为Y1、X11、X51。
步骤:Ls y c x1 x5 Genr x51=x5/e
44
Genr e=abs(resid) Genr c1=1/e
Dependent Variable: Y1 Method: Least Squares Date: 12/10/11 Time: 18:53 Sample: 1981 2010 Variable
Coefficient
Std. Error
45
t-Statistic Prob.
模型方程:Yˆ118.52544.076322X21.118324X4
Dependent Variable: Y Method: Least Squares Date: 12/12/11 Time: 14:25 Sample: 1981 2010 Included observations: 30
Variable C X2 X
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient -118.5254 4.076322 1.118324
Std. Error 61.55143 1.559355 0.304985
t-Statistic -1.925632 2.614109 3.666816
Prob. 0.0647 0.0145 0.0011
0.978010 Mean dependent var 901.1217 0.976381 S.D. dependent var 187.9450 Akaike info criterion 953729.5 Schwarz criterion -198.0722 F-statistic 1.277882 Prob(F-statistic)
1222.936 13.40482 13.54493 600.4235 0.000000
对序列做回归得到dw=1.277882,落入不能确定的区间,所以存在自相关。 检验异方差:
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(一)处理异方差
建立新序列为,y/e,1/e,x2/e,x4/e,分别命名为,y1,c1,x21,x41
Genr e=abs(resid) Ls y/e 1/e x2/e x4/e Genr y1=y/e Genr c1=1/e
46
Genr x21=x2/e Genr x41=x4/e
Dependent Variable: Y1 Method: Least Squares Date: 12/12/11 Time: 14:48 Sample: 1981 2010 Included observations: 30
Variable C1 X21
Coefficient -77.89504 4.731235
Std. Error 11.94723 0.300503
47
t-Statistic -6.519925 15.74441
Prob. 0.0000 0.0000
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
0.998929 Mean dependent var 16.31470 0.998849 S.D. dependent var 0.875438 Akaike info criterion 20.69259 Schwarz criterion -36.99683 Durbin-Watson stat
25.80730 2.666455 2.806575 1.207917
对新序列做回归,得到DW=1.207917,落入不能确定的区间,所以认为存在自相关。 检验异方差:
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
存在异方差。
(二),处理自相关。
对模型做广义差分回归,得AR(1)= 0.684453,经差分后得到新序列,设为 C2 Y2 X22 X42
步骤:genr y2=y1- 0.684453*y1(-1) 补数:genr y2=y1*(1-(0.684453)^2)^0.5 Genr c2=c1-0.684453*c1(-1) genr c2=c1*(1-(0.684453)^2)^0.5 Genr x22=x21-0.684453*x21(-1) genr x22=x21*(1-(0.684453)^2)^0.5 Genr x42=x41-0.684453*x41(-1) genr x42=x41*(1-(0.684453)^2)^0.5
48
Dependent Variable: Y2 Method: Least Squares Date: 12/12/11 Time: 14:58 Sample: 1981 2010 Included observations: 30
C2 X22 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
-103.3055 4.481023 15.79004 0.320482 -6.542445 13.98212 0.0000 0.0000 0.998790 Mean dependent var 5.316985 0.998700 S.D. dependent var 0.761781 Akaike info criterion 15.66839 Schwarz criterion -32.82487 Durbin-Watson stat
21.12765 2.388325 2.528445 1.760787
对新序列做回归,DW= 1.760787,1.57
将Xi按升序排列,i=2,4,删掉排在中间的n/4个,即30/4,删掉8个。将其余样本点划分为样本容量各为11个的两个子样本。
49
不存在异方差。
F检验:R²=0.998790,F=( R²/k)/【(1- R²)/(n-k-1)】= 11143.52>3.35 = F 0.05,2,27
至此,该模型已不存在异方差和自相关,T检验和F检验均合格,不存在多重共线性.得到回归方程为: Yˆ-103.3.554.481023X21.063276X4
十一,经济意义、统计意义的解释
对各解释变量偏回归系数的解释
ˆ4.481023ˆ62 41.06327
a:统计意义:
在X2,不变的情况下,X4增加一个单位,Y平均增加1.063276个单位 在X4不变的情况下,X2增加一个单位,Y平均增加4.481023个单位 b:经济意义:
在进口额不变的情况下,社会消费品零售总额每增加1亿元人民币,云南省固定资本形成总额平均增加1.063276亿元人民币。
在社会消费品零售总额不变的情况下,进口额每增加1亿元人民币,云南省固定资本形成总额平均增加4.481023亿元人民币。
十二、相关系数、大β系数、弹性系数
②偏相关系数 X2X4Y
rYX2X4
rYX
2
rYXrX
4
2
X4
2
rYX4
2
0.[1**********]70.[1**********]1*0.[1**********]3
0.[1**********]10.[1**********]3
2
2
0.44941
rX2X4
50