(相关系数)组合预测模型及应用

第23卷第2期

科技通报

BULLETINOFSCIENCEANDTECHNOLOGY

Vol.23No.2Mar.2007

2007年3月

组合预测模型及应用

(南昌航空工业学院

数学与信息科学学院,江西南昌330034)

摘要:通过主成分分析的方法,将非线性预测中的二次多项式预测、指数预测及灰色预测等3种不同

的预测方法组合在一起,提出了一种新的组合预测方法,并利用该方法对江西省的国民生产总值进行了预测。

关键词:灰色预测;非线性回归;组合预测;主成分分析中图分类号:O159

文献标识码:A

文章编号:1001-7119(2007)02-0159-04

TheApplicationofTheModelforCombinationForecasting

LIXi

(DepartmentofInformationandComputationalScience,NanchangInstituteofAeronauticalTechnology,

Nanchang,Jangxi,330034,China)

Abstract:Basedonthetwo-polynomialregressionforecasting,exponentregressionforecastingandgrayforcasting,anewkindofcombinationforecasting(method)ispresentbyapplyingthemethodofprincipalcomponentanalysis.TheGDPofJiangxiprovinceisforecastedbythismethod.

Keywords:grayforecasting;nonlinearityregression;combinationforecasting;principalcomponentanalysis

经济指标的准确预测是国家对宏观经济正确调控的必要前提,但经济系统是一个非常复杂的系非线性的、不确定性的作用关系;因此要准确地预测某一趋势,必须从多个方面统,其中存在着时变的、

进行考虑。预测方法多种多样,如线性与非线性回归预测模型,灰色系统GM(1,1)模型预测,马尔柯夫链预测模型,神经网络预测模型等等,每种预测各有其特点,在不同的方面有各自的优劣,因此为了准确地预测结果,可考虑采用组合预测法进行预测。组合预测模型的建立也有多种方法,如文[2]以误差绝对值的和为最小的标准建立的组合预测模型,文[3]的偏最小二乘法建立的组合预测模型;本文运用主成分分析的思想来建立组合预测模型,这一方法通过分析各种预测量间存在的起支配作用的本质特征及内部结构,找出了几种预测方法共同起作用的预测量,从而产生预测值。

组合预测模型的建立

假设对同一预测问题有m个预测模型,这m个预测模型预测值分别记为Y1,Y2,…,Ym,对各个不

收稿日期:2006-03-06作者简介:李

曦(1966-),男,江西进贤人,副教授,主要从事应用数学研究。

160

科技通报第23卷

同方法产生的Yi作为一个变量,对n个不同时间,计算出相应的预测值yij,(i=1,2,…,n;j=1,2,…,m),由此构造一个n×m矩阵,利用此矩阵求相关系数矩阵R=(rij),i,j=1,2,…

,m,其中n

y,

iji=1

rij=S,Sij=1! (yki-ikj-j…,m,

k=1

" iijj

对相关系数矩阵R计算其特征值,R的最大特征值记为λ1,把属于λ1的因子得分向量记为v1=(γ11,

,根据主成分思想,γγ12,…,γ1m)′1i是第i种预测对第一主成分的方差贡献率,贡献率越大,说明波动幅度

越大,那么在组合中所占的比例越多;否则,比例越少。因此,组合预测的比例可定为

22222

fi=γ1i/(γ11+γ12+…+γ1m)=γ1i(分母之和为1),i=1,2,…,m.

一般,若第一主成分的方差贡献率不足70%,可以考虑第二主成分,以第一、第二主成分的方差λ1和λ2

为权数,组合预测的比例可定为

22fi=(γ(i=1,2,…,m).1+γ2)/(λ1+λ2)1iλ2iλ

其组合预测模型为:

Y=f1Y1+f2Y2+…+fmYm

再利用该模型进行最后预测。

三种预测模型

下面我们选取江西省2000年至2004年的国内生产总值作为原始数据(见表1),分别采用三种模型进行预测。

表1

年份

2000~2004年江西省国内生产总值(亿元)TheGDPofJiangxiprovince2000-200420012175.68

20022450.48

20032830.46

20043495.94

Table1

20002003.07

GDP

2.1二次曲线预测GDP

从国内生产总值的散点图(图1)可以看出,GDP与时间呈非线性关系,可考虑用二次多项式进行非

线性回归,设Y1表示GDP的值,得二次曲线回归方程为:

Y1(t)=77.923t2-103.49t+2044.4

相关系数r=0.9973,对于n=5,α=0.01,查临界值为r0.01=0.9343,r>r0.01,故回归方程有效。

4000350030002500GDP

2000150010005000

2000

2001

图1

系列1

多项式(系列1)

(1)

200220032004

年份

GDP与时间的关系

Fig.1TherelationshipbetweenGDPandyears

第2期组合预测模型及应用

161

2.2用灰色系统GM(1,1)预测GDP

灰色系统是处理不完全信息的一种理论,灰色预测是指以GM(1,1)模型为基础的预测,其主要应用于时间序列预测,其方法是列出预测对象历史发展时间序列,并对其进行一次迭加得{X(t)},利用模型

dX+aX=b,得X(t)=(X(0)-b)e-at+b。根据前面列出的GDP数据得预测方程为:Y(t+1)=10063.07e0.2t×

21

(e0.2-1),由于观察到残差较大,故考虑用GM(1,1)模型进行残差修正,其残差序列e(t)生成的预测模型为:e(t+1)=594.72e0.4068t×(e0.4068-1),即修正后的预测模型为:

(2)Y2(t+1)=10063.07e0.2t×(e0.2-1)-δ(t-1)×594.72e0.4068t×(e0.4068-1)

1,t≥1

其中;δ(t-1)=

0,t<1

"

利用该模型进行预测可得预测值。

2.3指数曲线预测GDP

根据散点图,还可考虑用指数曲线进行回归预测:Y=atb,即lnY=lna+blnt,利用上述数据得lnY=

0.1377t+7.4265,R2=0.9704,即预测模型为:

Y3(t)=1679.9e0.1377t

相关系数r=0.985,说明效果较好。

(3)

组合预测模型

将三种预测方法预测结果汇聚成表2,将三种预测方法Yi(i=1,2,3)看作三个变量,

表2

3种预测方法的预测结果

Table2

年份

TheforecastingGDPbythreeforecastingmethod

Y22228.02272.82650.23048.03439.03774.0

Y31927.92212.52539.22914.03307.63837.9

Y42058.22211.42542.02946.434073946.8

Y2003.072175.682450.482830.463495.94

Y12018.82149.12436.22877.23475.04228.7

200020012002200320042005

求三个变量的相关系数矩阵R,其检验结果如下:

表3

KMO和Bartlett检验KMOandBartlett’sTest

0.77617.075

30.001

Table3

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

Approx.Chi-Square

Bartlett’sTestofSphericity

dfSig.

进行KMO统计检验及Bartlet’S球形检验(表3):当KMO值越大,表示变量间的共同因素越多,越

适合进行因子分析,一般若其值小于0.5,则不适合进行因子分析,本结果显示为0.776,适合做因子分析;表中Bartlet’S为0.01,小于1%,同样说明变量间具有相关性,适合做因子分析。

计算R的特征值得:λ1=2.975,λ2=0.018,λ3=0.007,由于

162

科技通报第23卷

λ1

=2.975=0.9916

123

说明第一主成分达到99.16%,故只考虑第一主成分,其相应于λ1的因子得分向量为v′1=(0.335,

,将其单位化为v1=(,,)′,最后得到组合预测模型为:0.335,0.334)′

Y4=1(Y1+Y2+Y3)

(4)

由于本例中的特殊情况,使三种方法组合的结果恰好近似为三种方法的平均值,根据上述模型可预测

2005年江西国内生产总值为3946.8亿元;根据江西省2005年国民经济和社会发展统计公报,2005年江西省GDP为4056.2亿元,实际值与预测值很接近,由此看出组合预测效果更好。

参考文献:

[1][2][3][4][5]

庄楚强,吴亚森.应用数理统计基础(第二版)[M].广州:华南理工大学出版社,2003,12.马

骥,张卫峰.组合预测方法在磷肥需求预测中的应用[J].统计与决策,2005,(6):周爱民,基于偏最小二乘法的情报组合预测法[J].统计与决策,2004,176(8):江西省统计局编.江西统计年鉴2005[M].北京:中国统计出版社,2005.

杨明媚,李华林.主成分分析在证券组合投资中的应用[J].统计与信息论坛,2004,

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

(上接第158页)

1aδ>(1a21+1a23)(1a12δ2+4)≈3.989;14

1Sδ1a-1S]≈2.391当i=2,j=3时,[1R2+1S2-1a24δ4-22][a33-331

1aδ>(1a21+1a23)(1a32δ2+4)≈2.193;34

1Sδ1a-1S]≈6.432当i=4,j=1时,[1R4+1S4-1a42δ2-44][a11-113

1aδ>(1a41+1a43)(1a12δ2+4)≈4.987;14

1Sδ1a-1S]≈3.198当i=4,j=3时,[1R4+1S4-1a42δ2-44][a33-331

1aδ>(1a41+1a43)(1a32δ2+4)≈2.741.34

故A∈LDD(1,1,1),且由以上数据得Mi(α)>1,其中α=1.

可见,矩阵A满足定理1的条件(1),因此,A是非奇异H-矩阵.

参考文献:

[1][2][3][4][5][6][7]

王广彬,洪振杰.非奇异H-矩阵的充分条件[J].高等学校计算数学学报,2003.6,25(2):184-192.李继成,张文修.H矩阵的判定[J].高等学校计算数学学报,1999,21(3):264-268.孙玉祥.广义对角占优矩阵的充分条件[J].高等学校计算数学学报,1997,13(3):216-223.杨舒先.H-矩阵的判定方法[J].青岛大学学报,2003.6,16(3):17-21.

吕洪斌.矩阵的弱α-连对角占优性及应用[J].东北师大学报(自然科学版),2005,37(2):10-14.高益明.矩阵广义对角占优和非奇的判定[J].东北师大学报(自然科学版),1982,3:23-28.高

健,黄廷祝.广义对角占优矩阵的充分条件[J].电子科技大学学报,2004,33(2):208-210.

第23卷第2期

科技通报

BULLETINOFSCIENCEANDTECHNOLOGY

Vol.23No.2Mar.2007

2007年3月

组合预测模型及应用

(南昌航空工业学院

数学与信息科学学院,江西南昌330034)

摘要:通过主成分分析的方法,将非线性预测中的二次多项式预测、指数预测及灰色预测等3种不同

的预测方法组合在一起,提出了一种新的组合预测方法,并利用该方法对江西省的国民生产总值进行了预测。

关键词:灰色预测;非线性回归;组合预测;主成分分析中图分类号:O159

文献标识码:A

文章编号:1001-7119(2007)02-0159-04

TheApplicationofTheModelforCombinationForecasting

LIXi

(DepartmentofInformationandComputationalScience,NanchangInstituteofAeronauticalTechnology,

Nanchang,Jangxi,330034,China)

Abstract:Basedonthetwo-polynomialregressionforecasting,exponentregressionforecastingandgrayforcasting,anewkindofcombinationforecasting(method)ispresentbyapplyingthemethodofprincipalcomponentanalysis.TheGDPofJiangxiprovinceisforecastedbythismethod.

Keywords:grayforecasting;nonlinearityregression;combinationforecasting;principalcomponentanalysis

经济指标的准确预测是国家对宏观经济正确调控的必要前提,但经济系统是一个非常复杂的系非线性的、不确定性的作用关系;因此要准确地预测某一趋势,必须从多个方面统,其中存在着时变的、

进行考虑。预测方法多种多样,如线性与非线性回归预测模型,灰色系统GM(1,1)模型预测,马尔柯夫链预测模型,神经网络预测模型等等,每种预测各有其特点,在不同的方面有各自的优劣,因此为了准确地预测结果,可考虑采用组合预测法进行预测。组合预测模型的建立也有多种方法,如文[2]以误差绝对值的和为最小的标准建立的组合预测模型,文[3]的偏最小二乘法建立的组合预测模型;本文运用主成分分析的思想来建立组合预测模型,这一方法通过分析各种预测量间存在的起支配作用的本质特征及内部结构,找出了几种预测方法共同起作用的预测量,从而产生预测值。

组合预测模型的建立

假设对同一预测问题有m个预测模型,这m个预测模型预测值分别记为Y1,Y2,…,Ym,对各个不

收稿日期:2006-03-06作者简介:李

曦(1966-),男,江西进贤人,副教授,主要从事应用数学研究。

160

科技通报第23卷

同方法产生的Yi作为一个变量,对n个不同时间,计算出相应的预测值yij,(i=1,2,…,n;j=1,2,…,m),由此构造一个n×m矩阵,利用此矩阵求相关系数矩阵R=(rij),i,j=1,2,…

,m,其中n

y,

iji=1

rij=S,Sij=1! (yki-ikj-j…,m,

k=1

" iijj

对相关系数矩阵R计算其特征值,R的最大特征值记为λ1,把属于λ1的因子得分向量记为v1=(γ11,

,根据主成分思想,γγ12,…,γ1m)′1i是第i种预测对第一主成分的方差贡献率,贡献率越大,说明波动幅度

越大,那么在组合中所占的比例越多;否则,比例越少。因此,组合预测的比例可定为

22222

fi=γ1i/(γ11+γ12+…+γ1m)=γ1i(分母之和为1),i=1,2,…,m.

一般,若第一主成分的方差贡献率不足70%,可以考虑第二主成分,以第一、第二主成分的方差λ1和λ2

为权数,组合预测的比例可定为

22fi=(γ(i=1,2,…,m).1+γ2)/(λ1+λ2)1iλ2iλ

其组合预测模型为:

Y=f1Y1+f2Y2+…+fmYm

再利用该模型进行最后预测。

三种预测模型

下面我们选取江西省2000年至2004年的国内生产总值作为原始数据(见表1),分别采用三种模型进行预测。

表1

年份

2000~2004年江西省国内生产总值(亿元)TheGDPofJiangxiprovince2000-200420012175.68

20022450.48

20032830.46

20043495.94

Table1

20002003.07

GDP

2.1二次曲线预测GDP

从国内生产总值的散点图(图1)可以看出,GDP与时间呈非线性关系,可考虑用二次多项式进行非

线性回归,设Y1表示GDP的值,得二次曲线回归方程为:

Y1(t)=77.923t2-103.49t+2044.4

相关系数r=0.9973,对于n=5,α=0.01,查临界值为r0.01=0.9343,r>r0.01,故回归方程有效。

4000350030002500GDP

2000150010005000

2000

2001

图1

系列1

多项式(系列1)

(1)

200220032004

年份

GDP与时间的关系

Fig.1TherelationshipbetweenGDPandyears

第2期组合预测模型及应用

161

2.2用灰色系统GM(1,1)预测GDP

灰色系统是处理不完全信息的一种理论,灰色预测是指以GM(1,1)模型为基础的预测,其主要应用于时间序列预测,其方法是列出预测对象历史发展时间序列,并对其进行一次迭加得{X(t)},利用模型

dX+aX=b,得X(t)=(X(0)-b)e-at+b。根据前面列出的GDP数据得预测方程为:Y(t+1)=10063.07e0.2t×

21

(e0.2-1),由于观察到残差较大,故考虑用GM(1,1)模型进行残差修正,其残差序列e(t)生成的预测模型为:e(t+1)=594.72e0.4068t×(e0.4068-1),即修正后的预测模型为:

(2)Y2(t+1)=10063.07e0.2t×(e0.2-1)-δ(t-1)×594.72e0.4068t×(e0.4068-1)

1,t≥1

其中;δ(t-1)=

0,t<1

"

利用该模型进行预测可得预测值。

2.3指数曲线预测GDP

根据散点图,还可考虑用指数曲线进行回归预测:Y=atb,即lnY=lna+blnt,利用上述数据得lnY=

0.1377t+7.4265,R2=0.9704,即预测模型为:

Y3(t)=1679.9e0.1377t

相关系数r=0.985,说明效果较好。

(3)

组合预测模型

将三种预测方法预测结果汇聚成表2,将三种预测方法Yi(i=1,2,3)看作三个变量,

表2

3种预测方法的预测结果

Table2

年份

TheforecastingGDPbythreeforecastingmethod

Y22228.02272.82650.23048.03439.03774.0

Y31927.92212.52539.22914.03307.63837.9

Y42058.22211.42542.02946.434073946.8

Y2003.072175.682450.482830.463495.94

Y12018.82149.12436.22877.23475.04228.7

200020012002200320042005

求三个变量的相关系数矩阵R,其检验结果如下:

表3

KMO和Bartlett检验KMOandBartlett’sTest

0.77617.075

30.001

Table3

Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.

Approx.Chi-Square

Bartlett’sTestofSphericity

dfSig.

进行KMO统计检验及Bartlet’S球形检验(表3):当KMO值越大,表示变量间的共同因素越多,越

适合进行因子分析,一般若其值小于0.5,则不适合进行因子分析,本结果显示为0.776,适合做因子分析;表中Bartlet’S为0.01,小于1%,同样说明变量间具有相关性,适合做因子分析。

计算R的特征值得:λ1=2.975,λ2=0.018,λ3=0.007,由于

162

科技通报第23卷

λ1

=2.975=0.9916

123

说明第一主成分达到99.16%,故只考虑第一主成分,其相应于λ1的因子得分向量为v′1=(0.335,

,将其单位化为v1=(,,)′,最后得到组合预测模型为:0.335,0.334)′

Y4=1(Y1+Y2+Y3)

(4)

由于本例中的特殊情况,使三种方法组合的结果恰好近似为三种方法的平均值,根据上述模型可预测

2005年江西国内生产总值为3946.8亿元;根据江西省2005年国民经济和社会发展统计公报,2005年江西省GDP为4056.2亿元,实际值与预测值很接近,由此看出组合预测效果更好。

参考文献:

[1][2][3][4][5]

庄楚强,吴亚森.应用数理统计基础(第二版)[M].广州:华南理工大学出版社,2003,12.马

骥,张卫峰.组合预测方法在磷肥需求预测中的应用[J].统计与决策,2005,(6):周爱民,基于偏最小二乘法的情报组合预测法[J].统计与决策,2004,176(8):江西省统计局编.江西统计年鉴2005[M].北京:中国统计出版社,2005.

杨明媚,李华林.主成分分析在证券组合投资中的应用[J].统计与信息论坛,2004,

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

(上接第158页)

1aδ>(1a21+1a23)(1a12δ2+4)≈3.989;14

1Sδ1a-1S]≈2.391当i=2,j=3时,[1R2+1S2-1a24δ4-22][a33-331

1aδ>(1a21+1a23)(1a32δ2+4)≈2.193;34

1Sδ1a-1S]≈6.432当i=4,j=1时,[1R4+1S4-1a42δ2-44][a11-113

1aδ>(1a41+1a43)(1a12δ2+4)≈4.987;14

1Sδ1a-1S]≈3.198当i=4,j=3时,[1R4+1S4-1a42δ2-44][a33-331

1aδ>(1a41+1a43)(1a32δ2+4)≈2.741.34

故A∈LDD(1,1,1),且由以上数据得Mi(α)>1,其中α=1.

可见,矩阵A满足定理1的条件(1),因此,A是非奇异H-矩阵.

参考文献:

[1][2][3][4][5][6][7]

王广彬,洪振杰.非奇异H-矩阵的充分条件[J].高等学校计算数学学报,2003.6,25(2):184-192.李继成,张文修.H矩阵的判定[J].高等学校计算数学学报,1999,21(3):264-268.孙玉祥.广义对角占优矩阵的充分条件[J].高等学校计算数学学报,1997,13(3):216-223.杨舒先.H-矩阵的判定方法[J].青岛大学学报,2003.6,16(3):17-21.

吕洪斌.矩阵的弱α-连对角占优性及应用[J].东北师大学报(自然科学版),2005,37(2):10-14.高益明.矩阵广义对角占优和非奇的判定[J].东北师大学报(自然科学版),1982,3:23-28.高

健,黄廷祝.广义对角占优矩阵的充分条件[J].电子科技大学学报,2004,33(2):208-210.


相关内容

  • 最小机会损失的组合预测模型精度评价
  • 最小机会损失的组合预测模型精度评价 王丰效 (喀什师范学院数学系,新疆喀什844000) 摘要:文章研究了组合预测模型预测精度的评价问题.一组单项预测模型在不同的准则下,建立的组合 预测模型一般是不同的.为了比较这些组合预测模型的预测精度,提出了基于最小机会损失准则进行综合评价的方法.该方法运用最小 ...

  • 基于组合预测模型的股票预测方法的研究
  • 第29卷第2期 Vol.29No.22008青岛理工大学学报JournalofQingdaoTechnologicalUniversity 基于组合预测模型的股票预测方法的研究 李春兴,白建东 (青岛理工大学中德信息技术研究所,青岛266033) 摘 要:对股票预测问题进行了深入的研究,提出了一个新 ...

  • 物流需求预测
  • (河北工程大学 管理科学与工程 阮俊虎) 物流需求是指一定时期内社会经济活动对生产.流通.消费领域的原材料.半成品和成品.商品以及废旧物品.废旧材料等的配置作用而产生的对物在空间.时间和费用方面的要求,涉及运输.库存.包装.装卸搬运.流通加工以及与之相关的信息需求等物流活动的诸方面[1].物流需求的 ...

  • 2011年全国大学生统计建模大赛论文二等奖第五名
  • 二重趋势时间序列的组合预测模型 广东外语外贸大学 陈文聪.庄文钿.苏玲 摘 要 时间序列预测是一个多学科交叉的研究领域,呈现趋势变动性和周期波动性的二重趋势时间序列更是经常出现在各种重要场合,建立有效模型对其准确预测尤为重要.本文基于二重趋势时间序列理论,以我国1992年-2010年各季度的国内生产 ...

  • 2015年[中级财务管理]公式汇总
  • 2015年<中级财务管理>公式汇总 第二章 财务管理基础 一.现值和终值的计算 终值与现值的计算及相关知识点列表如下: 表中字母含义:F----终值:P----现值:A----年金:i----利率:n----期间:m----递延期 二.利率的计算 (一)用内插法计算 方法一:i=i1+ ...

  • 创新扩散理论模型扩展及应用--以某地IPTV为例
  • 管 V01.22.No.4 理 工 程学报 2008年第4期 JournalofIndustrialEngineering/EngineeringManagement 创新扩散理论模型扩展及应用 --以某地IPTV为例 叶利生 (北京邮电大学经济管理学院,北京100876) 摘要:我国IPIV目前还 ...

  • 数学建模大赛一等奖作品
  • 数学建模论文 高速公路道路交通事故分析预测 摘 要 我国目前的道路交通安全状况相对于世界水平要差得多,高速公路道路交通事故所造成的损失非常高.因此,改善交通安全状况.预防和减少高速公路交通事故具有重大的现实意义.针对这样的现状,我们必须进行高速公路交通事故的预测,从而及早采取措施进行预防工作,从而减 ...

  • 投资组合优化模型
  • 投资组合优化模型 摘要 长期以来,金融资产固有的风险和由此产生的收益一直是金融投资界十分关注的课题.随着经济的快速发展,市场上的新兴资产也是不断涌现,越来越多的企业.机构和个人等都用一部分资金用来投资,而投资方式的多样性决定了人们在投资过程中投资组合的多样性.而每一项投资在有其收益效果的同时也伴随着 ...

  • 目标企业产品销量的预测模型与分析
  • 2008年第3期(总第145期) 山东纺织经济 目标企业产品销量的预测模型与分析 大目吴蕾 (长春税务学院经济模拟研究所吉林长春 1:5011 7) 摘要:本文主要应用时间序列模型中的AEIMA模型.疏系数ARIMA模型和自回归.残差自回归几种模型,对目标空调企业1996-2007年的全国空调总销售 ...