灰色预测模型理论及其应用
灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.
灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.本文主要围绕灰色预测GM(1,1)模型及其应用进行展开。
一、灰色系统及灰色预测的概念
1.1灰色系统
灰色系统产生于控制理论的研究中。 若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。
若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统便是黑色系统。
灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。 区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。 特点:灰色系统理论以“部分信息已知、部分信息未知”的 “小样本”、“贫信息”不确定型系统的研究对象。 1.2灰色预测
灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。灰色预测是用灰色模型GM(1,1)来进行定量分析的,通常分为以下几类:
(1) 灰色时间序列预测。用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征量的时间。
(2) 畸变预测(灾变预测)。通过模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
(3) 波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。
(4) 系统预测,是对系统行为特征指标建立一族相互关联的灰色预测理论模型,在预测系统整体变化的同时,预测系统各个环节的变化。
上述灰预测方法的共同特点是: (1)允许少数据预测;
(2)允许对灰因果律事件进行预测,比如 灰因白果律事件:在粮食生产预测中,影响粮食生产的因子很多,多到无法枚举,故为灰因,然而粮食产量却是具体的,故为白果。粮食预测即为灰因白果律事件预测。
白因灰果律事件 :在开发项目前景预测时,开发项目的投入是具体的,为白因,而项目的效益暂时不很清楚,为灰果。项目前景预测即为灰因白果律事件预测。
(3)具有可检验性,包括:建模可行性的级比检验(事前检验),建模精度检验(模型检验),预测的滚动检验(预测检验)。
二、GM(1,1)模型
2.1GM(1,1)模型
GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.
2.2GM(1,1)模型的建立
GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.
模型符号含义为
(1,)
阶方程个变量
设时间序列X
0
有n个观察值,X
0
x01,x02,,x0n,为了使其成为
有规律的时间序列数据,对其作一次累加生成运算,即令
x
从而得到新的生成数列X
1
1
tx0n
n1
t
,X
1
x11,x12,,x1n,称
x(0)(k)ax(1)(k)b
为GM(1,1)模型的原始形式。 新的生成数列X
1
一般近似地服从指数规律. 则生成的离散形式的微分方程具体的形式为
dx
axu dt
即表示变量对于时间的一阶微分方程是连续的. 求解上述微分方程,解为
u
x(t)cea(t1)
a
u
当t=1时,x(t)x(1),即cx(1),则可根据上述公式得到离散形式微分方程的具体
a
形式为
uat1u
xtx1e
aa
其中,ax项中的x为
dx
的背景值,也称初始值;a,u是待识别的灰色参数,a为发展系dt
数,反映x的发展趋势;u为灰色作用量,反映数据间的变化关系.
按白化导数定义有
dxx(tt)x(t)lim dtt0t
显然,当时间密化值定义为1时,当t1时,则上式可记为
dx
lim(x(tt)x(t)) dtt1
这表明
dx
是一次累减生成的,因此该式可以改写为 dt
dx
x(1)(t1)x(1)(t) dt
当t足够小时,变量x从x(t)到x(tt)是不会出现突变的,所以取x(t)与x(tt)的平均值作为当t足够小时的背景值,即x生成序列)将其值带入式子,整理得
(1)
1(1)
x(t)x(1)(t1)(紧邻均值(MEAN)2
1(1)(1)
x(0)(t1)ax(t)x(t1)u(GM(1,1)模型的均值形式) 2
由其离散形式可得到如下矩阵:
1(1)(1)
x(1)x(2)2x(0)(2)1(0)x(1)(2)x(1)(3)x(3)au 2
x(0)(n)
1(1)(1)
x(n1)x(n)2
令 Yx
(0)
(2),x(0)(3),,x(0)(n)
T
1(1)(1)1x(1)x(2)2
1x(1)(2)x(1)(3)1 B2
1(1)(1)
x(n1)x(n)12
au
称Y为数据向量,B为数据矩阵,为参数向量. 则上式可简化为线性模型:
YB
由最小二乘估计方法得
1TaT
BBBY
u
T
上式即为GM(1,1)参数a,u的矩阵辨识算式,式中BB义逆矩阵.
将求得的a,u值代入微分方程的解式,则
T
1
BTY事实上是数据矩阵B的广
ua(t1)u(1)
ˆ(1)(t)xx(1) e
aa
其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得
ua(t1)u(0)
ˆ(1)(t)xx(1) e
aa
ˆ对序列x
1
t再作累减生成可进行预测. 即
ˆ(0)(t)xˆ(1)(t)xˆ(1)(t1)x
u(0)aa(t1)
x(1)1ee
a
上式便是GM(1,1)模型的预测的具体计算式.
2.3 GM(1,1)模型的检验
GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式. 每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度. 残差检验
残差大小检验,即对模型值和实际值的残差进行逐点检验.
设模拟值的残差序列为e(t),则
(0)
ˆ(0)(t) e(0)(t)x(0)(t)x
令(t)为残差相对值,即残差百分比为
ˆ(0)(t)x(0)(t)x
(t)% (0)
x(t)
1n
令为平均残差,(t).
nt1
一般要求t20%,最好是t10%,符合要求.
关联度检验
关联度是用来定量描述各变化过程之间的差别. 关联系数越大,说明预测值和实际值越接近.
ˆ设 X
(0)
ˆ(0)(1),xˆ(0)(2),,xˆ(0)(n) (t)x
X(0)(t)x(0)(1),x(0)(2),,x(0)(n)
序列关联系数定义为
minxˆ(0)(t)x(0)(t)maxxˆ(0)(t)x(0)(t),t0(0)(0)(0)(0)txˆ(t)x(t)maxxˆ(t)x(t)
,t01
ˆ(0)(t)x(0)(t)为第t个点x式中,x
(0)
ˆ和x
(0)
的绝对误差,(t)为第t个数据的关联系数,
称为分辨率,即取定的最大差百分比,0,一般取0.5.
ˆ(0)(t)的关联度为 x(0)(t)和x
1n
rt
nt1
关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.
后验差检验
后验差检验,即对残差分布的统计特性进行检验. 检验步骤如下:
1、计算原始时间数列X
0
x(0)(1),x(0)(2),,x(0)(n)的均值和方差
(0)
21n(0)1n(0)2
x(t),S1x(t) nt1nt1
2、计算残差数列e
(0)
2e(0)(1),e(0)(2),,e(0)(n)的均值和方差s2
21n(0)1n(0)2
e(t),S2e(t)
nt1nt1
ˆ(t),t1,2,,n为残差数列. 其中e(t)x(t)x
(0)(0)(0)
3、计算后验差比值
CS2S1
4、计算小误差频率
PPe(0)(t)0.6745S1
令S0=0.6745S1,(t)|e(0)(t)|,即PP(t)S0.
若对给定的C00,当CC0时,称模型为方差比合格模型;若对给定的
P00,当PP0时,称模型为小残差概率合格模型.
P
>0.95 >0.80 >0.70
C
0.65
模型精度 优 合格 勉强合格 不合格
表 3 后验差检验判别参照表
2.3 GM(1,1)模型修正(残差GM(1,1)模型) 当原始数据序列X
(0)
建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修
正. 如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.
若用原始序列X
(0)
建立的GM(1,1)模型
uu
ˆ(1)(t1)[x(0)(1)]eat x
aa
可获得生成序列X
(1)
ˆ(1)(k). 若取k=t, 的预测值,定义残差序列e(0)(k)x(1)(k)x
e(0)(k)e(0)(1),e(0)(2),,e(0)(n)
t+1, „, n,则对应的残差序列为
计算其生成序列e(k),并据此建立相应的GM(1,1)模型
(1)
ˆ(1)(t1)[e(0)(1)e
得修正模型
ueaekue
]e aeae
uuu
x(1)(t1)x(0)(1)eak(kt)(ae)e(0)(1)eeaek
aaae
其中(kt)
1kt
为修正参数.
0kt
三、GM(1,1)模型的应用
(1)
第一步:构造累加生成序列X;
X(1)x(1)(1),x(1)(2),x(1)(3),x(1)(4),x(1)(5),x(1)(6),x(1)(7),x(1)(8),x(1)(9),x(1)(10)
24.4109,51.1416,81.5294,117.9101,158.9262,202.6562,251.0662,312.0662,369.0662,432.166
第二步:计算系数值; 对X
(1)
做紧邻均值生成. 令Z(1)(k)0.5x(1)(k)0.5x(1)(k1),得
Z(1)z(1)(2),z(1)(3),z(1)(4),z(1)(5),z(1)(6),z(1)(7),z(1)(8),z(1)(9),z(1)(,10)
37.77625,66.3355,99.71975,138.41815,180.7912,226.8612,281.5662,340.5662,400.6161
则数据矩阵B及数据向量Y为
z(1)(2)(1)
z(3)z(1)(4)
z(1)(5)B=(1)
z(6)z(1)(7)
z(1)(8)(1)
z(9)
x(0)(2)26.73071-37.77625 1
-66.3355 1(0)30.38781x(3)
-99.71975 1x(0)(4)36.3807141.0161-138.41815 1(0)x(5)1
-180.7912 1,Y(0)43.73 1x(6)48.41-226.8612 1x(0)(7)1-281.5662 161
(0)x(8)571-340.5662 1
(0)
1-400.6161 1x(9)63.1
ˆ[a,u]T进行最小二乘估计,得 对参数列a
0.101624T
ˆ(BTB)1BTYBTY a[a,u]
25.290111
即 a0.101624,u25.290111
α= -0.101624 , μ=25.290111 , 平均相对误差为4.685749%
第三步:得出时间响应预测函数模型为:
X1k1273.269896e0.101624k248.858996
第四步:进行灰色关联度检验。
真实值:
{24.4109,26.7307,30.3878,36.3807,41.0161,43.7300,48.4100,61.0000,57.0000,63.1000}
预测值:
{24.4109,29.2310,32.3578,35.8190,39.6504,43.8917,48.5867,53.7839,59.5371,65.9056}
计算得到关联系数为: {1,0.906683,0.444273,0.416579,0.82377,0.357133,0.715694,0.843178,0.333333,0.770986}
于是灰色关联度:r=0.661163
关联度r=0.661163满足分辨率=0.5时的检验准则r>0.60,关联性检验通过。 第五步:后验差检验。 计算真实值的均值与标准差:计算残差的均值和标准差:0
43.2166,S114.0254
1.9295,S24.6134
于是方差比 C=S2/S1=0.3289
S0=0.6745*S1=9.4601
ekk1.9295,0.5708,0.0405,1.3678,0.5638,1.7677,1.7527,5.2866,0.6076,0.8761
所有ek都小于S0,故小误差概率PpeiS01,又C
(1)得到模拟值、残差和相对误差如下:
序号 模拟值 残差 相对误差(%)
1 24.4109 0 0
2 29.230986 2.500286 9.353612 3 32.357751 1.969951 6.482704 4 35.818976 -.561724 -1.544016 5 39.650442 -1.365658 -3.329566 6 43.891749 .161749 .369881 7 48.586737 .176737 .365084 8 53.783938 -7.216062 -11.82961 9 59.537068 2.537068 4.450996 10 65.905597 2.805597 4.446271
相对误差序列中有的相对误差很大,所以要对原模型
X1k1273.269896e0.101624k248.858996
进行残差修正,以提高精度。
(2)利用残差对原模型进行修正:
我们取
e0{2.500286,1.969951,0.561724,1.365658,0.161749 ,0.176737,7.216062,
2.537068,2.805597}
同样的可求得 α= -0.183488 , μ=0.481549 则有
0n0.183488k
ˆk1eee2.62442
an
5.124706e0.183488k2.62442
1
对上述求导,得:
1
ˆek10.9403e0.183488k
这样就得到经过残差修正后的灰色预测GM(1,1)模型:
X1k1273.269896e0.101624k248.858996
k10.9403e0.183488k
1,k2
k1 为修正系数(k=0,1,2,„„)其中: 。
0,k2
修正后,精度有所提高。修正后的残差计算见下表:
因此,可用上述经过残差修正后的灰色模型来预测2014年及2020年南昌市民用汽车保有量的估计值:
k8,X19438.0755 k9,X110512.0180
于是得到
2014
年南昌市民用汽车保有量的预测值为
X110X1973.9425(万辆)
同理可以得到2020年南昌市民用汽车保有量的预测值为137.2035万辆。
灰色预测模型理论及其应用
灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测. 尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测.
灰色预测模型只需要较少的观测数据即可,这和时间序列分析,多元回归分析等需要较多数据的统计模型不一样. 因此,对于只有少量观测数据的项目来说,灰色预测是一种有用的工具.本文主要围绕灰色预测GM(1,1)模型及其应用进行展开。
一、灰色系统及灰色预测的概念
1.1灰色系统
灰色系统产生于控制理论的研究中。 若一个系统的内部特征是完全已知的,即系统的信息是充足完全的,我们称之为白色系统。
若一个系统的内部信息是一无所知,一团漆黑,只能从它同外部的联系来观测研究,这种系统便是黑色系统。
灰色系统介于二者之间,灰色系统的一部分信息是已知的,一部分是未知的。 区别白色和灰色系统的重要标志是系统各因素间是否有确定的关系。 特点:灰色系统理论以“部分信息已知、部分信息未知”的 “小样本”、“贫信息”不确定型系统的研究对象。 1.2灰色预测
灰色系统分析方法是通过鉴别系统因素之间发展趋势的相似或相异程度,即进行关联度分析,并通过对原始数据的生成处理来寻求系统变动的规律。生成数据序列有较强的规律性,可以用它来建立相应的微分方程模型,从而预测事物未来的发展趋势和未来状态。灰色预测是用灰色模型GM(1,1)来进行定量分析的,通常分为以下几类:
(1) 灰色时间序列预测。用等时距观测到的反映预测对象特征的一系列数量(如产量、销量、人口数量、存款数量、利率等)构造灰色预测模型,预测未来某一时刻的特征量,或者达到某特征量的时间。
(2) 畸变预测(灾变预测)。通过模型预测异常值出现的时刻,预测异常值什么时候出现在特定时区内。
(3) 波形预测,或称为拓扑预测,它是通过灰色模型预测事物未来变动的轨迹。
(4) 系统预测,是对系统行为特征指标建立一族相互关联的灰色预测理论模型,在预测系统整体变化的同时,预测系统各个环节的变化。
上述灰预测方法的共同特点是: (1)允许少数据预测;
(2)允许对灰因果律事件进行预测,比如 灰因白果律事件:在粮食生产预测中,影响粮食生产的因子很多,多到无法枚举,故为灰因,然而粮食产量却是具体的,故为白果。粮食预测即为灰因白果律事件预测。
白因灰果律事件 :在开发项目前景预测时,开发项目的投入是具体的,为白因,而项目的效益暂时不很清楚,为灰果。项目前景预测即为灰因白果律事件预测。
(3)具有可检验性,包括:建模可行性的级比检验(事前检验),建模精度检验(模型检验),预测的滚动检验(预测检验)。
二、GM(1,1)模型
2.1GM(1,1)模型
GM(1,1)模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,这样可以对变化过程作较长时间的描述,进而建立微分方程形式的模型. 其建模的实质是建立微分方程的系数,将时间序列转化为微分方程,通过灰色微分方程可以建立抽象系统的发展模型. 经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律时,灰色预测GM(1,1)模型的预测将是非常成功的.
2.2GM(1,1)模型的建立
GM(1,1)模型是指一阶,一个变量的微分方案预测模型,是一阶单序列的线性动态模型,用于时间序列预测的离散形式的微分方程模型.
模型符号含义为
(1,)
阶方程个变量
设时间序列X
0
有n个观察值,X
0
x01,x02,,x0n,为了使其成为
有规律的时间序列数据,对其作一次累加生成运算,即令
x
从而得到新的生成数列X
1
1
tx0n
n1
t
,X
1
x11,x12,,x1n,称
x(0)(k)ax(1)(k)b
为GM(1,1)模型的原始形式。 新的生成数列X
1
一般近似地服从指数规律. 则生成的离散形式的微分方程具体的形式为
dx
axu dt
即表示变量对于时间的一阶微分方程是连续的. 求解上述微分方程,解为
u
x(t)cea(t1)
a
u
当t=1时,x(t)x(1),即cx(1),则可根据上述公式得到离散形式微分方程的具体
a
形式为
uat1u
xtx1e
aa
其中,ax项中的x为
dx
的背景值,也称初始值;a,u是待识别的灰色参数,a为发展系dt
数,反映x的发展趋势;u为灰色作用量,反映数据间的变化关系.
按白化导数定义有
dxx(tt)x(t)lim dtt0t
显然,当时间密化值定义为1时,当t1时,则上式可记为
dx
lim(x(tt)x(t)) dtt1
这表明
dx
是一次累减生成的,因此该式可以改写为 dt
dx
x(1)(t1)x(1)(t) dt
当t足够小时,变量x从x(t)到x(tt)是不会出现突变的,所以取x(t)与x(tt)的平均值作为当t足够小时的背景值,即x生成序列)将其值带入式子,整理得
(1)
1(1)
x(t)x(1)(t1)(紧邻均值(MEAN)2
1(1)(1)
x(0)(t1)ax(t)x(t1)u(GM(1,1)模型的均值形式) 2
由其离散形式可得到如下矩阵:
1(1)(1)
x(1)x(2)2x(0)(2)1(0)x(1)(2)x(1)(3)x(3)au 2
x(0)(n)
1(1)(1)
x(n1)x(n)2
令 Yx
(0)
(2),x(0)(3),,x(0)(n)
T
1(1)(1)1x(1)x(2)2
1x(1)(2)x(1)(3)1 B2
1(1)(1)
x(n1)x(n)12
au
称Y为数据向量,B为数据矩阵,为参数向量. 则上式可简化为线性模型:
YB
由最小二乘估计方法得
1TaT
BBBY
u
T
上式即为GM(1,1)参数a,u的矩阵辨识算式,式中BB义逆矩阵.
将求得的a,u值代入微分方程的解式,则
T
1
BTY事实上是数据矩阵B的广
ua(t1)u(1)
ˆ(1)(t)xx(1) e
aa
其中,上式是GM(1,1)模型的时间响应函数形式,将它离散化得
ua(t1)u(0)
ˆ(1)(t)xx(1) e
aa
ˆ对序列x
1
t再作累减生成可进行预测. 即
ˆ(0)(t)xˆ(1)(t)xˆ(1)(t1)x
u(0)aa(t1)
x(1)1ee
a
上式便是GM(1,1)模型的预测的具体计算式.
2.3 GM(1,1)模型的检验
GM(1,1)模型的检验包括残差检验、关联度检验、后验差检验三种形式. 每种检验对应不同功能:残差检验属于算术检验,对模型值和实际值的误差进行逐点检验;关联度检验属于几何检验范围,通过考察模型曲线与建模序列曲线的几何相似程度进行检验,关联度越大模型越好;后验差检验属于统计检验,对残差分布的统计特性进行检验,衡量灰色模型的精度. 残差检验
残差大小检验,即对模型值和实际值的残差进行逐点检验.
设模拟值的残差序列为e(t),则
(0)
ˆ(0)(t) e(0)(t)x(0)(t)x
令(t)为残差相对值,即残差百分比为
ˆ(0)(t)x(0)(t)x
(t)% (0)
x(t)
1n
令为平均残差,(t).
nt1
一般要求t20%,最好是t10%,符合要求.
关联度检验
关联度是用来定量描述各变化过程之间的差别. 关联系数越大,说明预测值和实际值越接近.
ˆ设 X
(0)
ˆ(0)(1),xˆ(0)(2),,xˆ(0)(n) (t)x
X(0)(t)x(0)(1),x(0)(2),,x(0)(n)
序列关联系数定义为
minxˆ(0)(t)x(0)(t)maxxˆ(0)(t)x(0)(t),t0(0)(0)(0)(0)txˆ(t)x(t)maxxˆ(t)x(t)
,t01
ˆ(0)(t)x(0)(t)为第t个点x式中,x
(0)
ˆ和x
(0)
的绝对误差,(t)为第t个数据的关联系数,
称为分辨率,即取定的最大差百分比,0,一般取0.5.
ˆ(0)(t)的关联度为 x(0)(t)和x
1n
rt
nt1
关联度大于60%便满意了,原始数据与预测数据关联度越大,模型越好.
后验差检验
后验差检验,即对残差分布的统计特性进行检验. 检验步骤如下:
1、计算原始时间数列X
0
x(0)(1),x(0)(2),,x(0)(n)的均值和方差
(0)
21n(0)1n(0)2
x(t),S1x(t) nt1nt1
2、计算残差数列e
(0)
2e(0)(1),e(0)(2),,e(0)(n)的均值和方差s2
21n(0)1n(0)2
e(t),S2e(t)
nt1nt1
ˆ(t),t1,2,,n为残差数列. 其中e(t)x(t)x
(0)(0)(0)
3、计算后验差比值
CS2S1
4、计算小误差频率
PPe(0)(t)0.6745S1
令S0=0.6745S1,(t)|e(0)(t)|,即PP(t)S0.
若对给定的C00,当CC0时,称模型为方差比合格模型;若对给定的
P00,当PP0时,称模型为小残差概率合格模型.
P
>0.95 >0.80 >0.70
C
0.65
模型精度 优 合格 勉强合格 不合格
表 3 后验差检验判别参照表
2.3 GM(1,1)模型修正(残差GM(1,1)模型) 当原始数据序列X
(0)
建立的GM(1,1)模型检验不合格时,可以用GM(1,1)残差模型来修
正. 如果原始序列建立的GM(1,1)模型不够精确,也可以用GM(1,1)残差模型来提高精度.
若用原始序列X
(0)
建立的GM(1,1)模型
uu
ˆ(1)(t1)[x(0)(1)]eat x
aa
可获得生成序列X
(1)
ˆ(1)(k). 若取k=t, 的预测值,定义残差序列e(0)(k)x(1)(k)x
e(0)(k)e(0)(1),e(0)(2),,e(0)(n)
t+1, „, n,则对应的残差序列为
计算其生成序列e(k),并据此建立相应的GM(1,1)模型
(1)
ˆ(1)(t1)[e(0)(1)e
得修正模型
ueaekue
]e aeae
uuu
x(1)(t1)x(0)(1)eak(kt)(ae)e(0)(1)eeaek
aaae
其中(kt)
1kt
为修正参数.
0kt
三、GM(1,1)模型的应用
(1)
第一步:构造累加生成序列X;
X(1)x(1)(1),x(1)(2),x(1)(3),x(1)(4),x(1)(5),x(1)(6),x(1)(7),x(1)(8),x(1)(9),x(1)(10)
24.4109,51.1416,81.5294,117.9101,158.9262,202.6562,251.0662,312.0662,369.0662,432.166
第二步:计算系数值; 对X
(1)
做紧邻均值生成. 令Z(1)(k)0.5x(1)(k)0.5x(1)(k1),得
Z(1)z(1)(2),z(1)(3),z(1)(4),z(1)(5),z(1)(6),z(1)(7),z(1)(8),z(1)(9),z(1)(,10)
37.77625,66.3355,99.71975,138.41815,180.7912,226.8612,281.5662,340.5662,400.6161
则数据矩阵B及数据向量Y为
z(1)(2)(1)
z(3)z(1)(4)
z(1)(5)B=(1)
z(6)z(1)(7)
z(1)(8)(1)
z(9)
x(0)(2)26.73071-37.77625 1
-66.3355 1(0)30.38781x(3)
-99.71975 1x(0)(4)36.3807141.0161-138.41815 1(0)x(5)1
-180.7912 1,Y(0)43.73 1x(6)48.41-226.8612 1x(0)(7)1-281.5662 161
(0)x(8)571-340.5662 1
(0)
1-400.6161 1x(9)63.1
ˆ[a,u]T进行最小二乘估计,得 对参数列a
0.101624T
ˆ(BTB)1BTYBTY a[a,u]
25.290111
即 a0.101624,u25.290111
α= -0.101624 , μ=25.290111 , 平均相对误差为4.685749%
第三步:得出时间响应预测函数模型为:
X1k1273.269896e0.101624k248.858996
第四步:进行灰色关联度检验。
真实值:
{24.4109,26.7307,30.3878,36.3807,41.0161,43.7300,48.4100,61.0000,57.0000,63.1000}
预测值:
{24.4109,29.2310,32.3578,35.8190,39.6504,43.8917,48.5867,53.7839,59.5371,65.9056}
计算得到关联系数为: {1,0.906683,0.444273,0.416579,0.82377,0.357133,0.715694,0.843178,0.333333,0.770986}
于是灰色关联度:r=0.661163
关联度r=0.661163满足分辨率=0.5时的检验准则r>0.60,关联性检验通过。 第五步:后验差检验。 计算真实值的均值与标准差:计算残差的均值和标准差:0
43.2166,S114.0254
1.9295,S24.6134
于是方差比 C=S2/S1=0.3289
S0=0.6745*S1=9.4601
ekk1.9295,0.5708,0.0405,1.3678,0.5638,1.7677,1.7527,5.2866,0.6076,0.8761
所有ek都小于S0,故小误差概率PpeiS01,又C
(1)得到模拟值、残差和相对误差如下:
序号 模拟值 残差 相对误差(%)
1 24.4109 0 0
2 29.230986 2.500286 9.353612 3 32.357751 1.969951 6.482704 4 35.818976 -.561724 -1.544016 5 39.650442 -1.365658 -3.329566 6 43.891749 .161749 .369881 7 48.586737 .176737 .365084 8 53.783938 -7.216062 -11.82961 9 59.537068 2.537068 4.450996 10 65.905597 2.805597 4.446271
相对误差序列中有的相对误差很大,所以要对原模型
X1k1273.269896e0.101624k248.858996
进行残差修正,以提高精度。
(2)利用残差对原模型进行修正:
我们取
e0{2.500286,1.969951,0.561724,1.365658,0.161749 ,0.176737,7.216062,
2.537068,2.805597}
同样的可求得 α= -0.183488 , μ=0.481549 则有
0n0.183488k
ˆk1eee2.62442
an
5.124706e0.183488k2.62442
1
对上述求导,得:
1
ˆek10.9403e0.183488k
这样就得到经过残差修正后的灰色预测GM(1,1)模型:
X1k1273.269896e0.101624k248.858996
k10.9403e0.183488k
1,k2
k1 为修正系数(k=0,1,2,„„)其中: 。
0,k2
修正后,精度有所提高。修正后的残差计算见下表:
因此,可用上述经过残差修正后的灰色模型来预测2014年及2020年南昌市民用汽车保有量的估计值:
k8,X19438.0755 k9,X110512.0180
于是得到
2014
年南昌市民用汽车保有量的预测值为
X110X1973.9425(万辆)
同理可以得到2020年南昌市民用汽车保有量的预测值为137.2035万辆。