回归预测法

回归预测法,是分析因变量与自变量之间相互关系,用回归方程表示,根据自变量的数值变化,去预测因变量数值变化的方法。

在经济预测中,人们把预测对象当作因变量,把那些与预测对象有关的因素当作自变量,收集自变量的充分数据,应用相关分析和回归分析求得回归方程,并利用回归方程进行预测。 回归预测法中的自变量,与时间序列预测法中的自变量不相同。后者的自变量是时间本身,而前者的自变量不是时间本身,而是其他的变量。

回归预测法中的自变量与因变量之间,有的属于因果关系,有的屑于伴随关系。不能认为只有因果关系才能进行回归预测,实际上伴随关系也是一种相关关系,只要收集大量的足够的资料,也可以用回归预测法进行预测。

在回归预测法中,自变量不是随机的或者是给定的,这与相关分析中自变量有所区别。相关分析中的自变量是随机的。

二、回归预测法的条件

在作回归预测时必须注意下列几个问题,这些问题是提高预测准确度的条件。

(1)经济现象之间, 即作为因变量与自变量之间必须有关系。怎样剖析两者有相关关系呢?从根本上说,只有通过马克思主义政治经济学的理论分析,才能正确作出判断,正确认识经济

现象之间的内在的必然联系和外部的偶然联系,不为假相关所迷惑。因此,切不可轻视理论分析而草率运用回归预测法。

(2)因变量与自变量之间的关系必须密切, 要有强相关,而自变量与另一个自变量之间的关系,必须不密切,要求弱相关或零相关。

判断相关关系密切程度的方法,可以通过绘制相关图和计算相关系数。根据历史资料绘制的相关图能判断相关的类型。相关图的类型如有以下几种。

①零相关图。当自变量x与因变量y没有相关关系,称为零相关,如图10-1。

②强正相关图。当自变量x增大时, 因变量y亦随之增大,点子的分布集中,呈直线形。故两者有强相关。如图10-2。

③弱正相关图。 当自变量x的数值增大时,y的数值也增大,但点子的分布不集中,两者之间仅有一定相关关系,称弱正相关。如图10-3。

④强负相关图。当自变量x增大时,因变量y亦随之减少,点子的分布集中呈直线形, 两者之间有强烈的相关关系,称强负相关。如图10-4。

⑤弱负相关图。当自变量x增大时,因变量y随之减少,点子的分布分散不集中,两者之间仅有一定的相关关系,称弱负相关。如图10-5。

相关系数也能从数量上说明相关的密切程度,一般规定: ︱r︱在0.3以下——无相关;

︱r︱在0.3~0.5——低度相关;

︱r︱在0.5~0.——显著相关;

︱r︱在0.8以上——高度相关。

(3)自变量的预测值必须比因变量的预测值精确或容易求得。 因为预测因变量的未来情况,必须有自变量的未来数据代入回归方程式才能计算出来。如果自变量的预测值更难求得,那么,该回归方程的应用价值就不大了。

(4)要正确地选择回归方程的形式。 亦即选择因变量和自变量的关系式是直线方程式还是曲线方程式;是一个自变量还是几个自变量。另外,还要注意计算简便,易于掌握。

(5)要有简单而又有效的验证方法。

三、回归预测法的种类和步骤

(一)回归预测法的种类

1.一元回归预测。

一元回归预测就是用相关分析法分析一个自变量和一个因变量之间的相关关系,利用一元回归方程式进行预测。例如,从居民货币收入预测某种耐用消费品的销售量;从工人劳动生产率预测利润额;从施肥量预测某种农作物的收获率等等。

2.多元回归预测。

多元回归预测就是分析一个因变量与若干个自变量的相关关系,建立多元回归方程,从若干自变量的变化去预测一个因变量的变化程度和未来的数量状况。例如,从施肥量、气温、降雨

量去预测某种农作物的收获率;从商业企业的职工劳动生产率和流通费率去预测利润率等等。

3.自回归预测。

自回归预测就是用一个时间数列的因变量数列与向过去推移若干时期的一个或几个自变量数列进行预测。例如对按月编制的时间数列,用今年1~12月的数列作为因变量数列, 用以前某月至某月的数列作为自变量数列,计算其相关系数,建立回归方程进行预测。

从回归方程的类型看,还可分为线性回归方程预测和曲线回归方程预测两种。

(二)回归预测法的步骤

回归预测法的步骤并不是固定不变的,而是非常灵活的。一般有以下几个步骤:

1.筛选自变量

首先,分析各自变量与因变量之间的相关关系,观察其相关关系的表现形式及密切程度。选用那些与因变量关系最为密切的自变量。在用多元回归预测时,还要分析各自变量之间的相关关系,选用那些关系不密切的自变量。如有两个自变量相互关系很密切,则应舍弃其中的一个。

2.确定回归方程式

根据理论分析和相关分析,如果有几个重要因素同时对预测对象有影响作用,而且关系密切,可以确定用多元回归方程式;如果其中某一个是基本的,起决定作用的,而其他因素影响作用不大或相关关系不密切,则可以确定用一元回归方程式进行预测。如果自变量和因变量之间的数据分布是线性趋势,可确定用直线回归方程;如果是曲线趋势,可确定用曲线回归方程。回归方程式确定以后,就要求回归方程中未知参数。当参数和自变量的预测值求出后,这个回归方程就可作为从自变量去预测因变量的预测公式。

求回归方程式中参数值的方法很多,上面曾经介绍过最小平

方法,这里不再赘述。只另外介绍一下求一元直线回归方程中参数

(1)两点法。

例如已知直线上两点:P点和Q点的坐标:P点为(4,4),Q点为(10,7),则 的简单方法。

得直线回归方程:

(2)解联立方程组法。因为直线上的任何一点都有一对满足直线方程式的坐标。如上例:P点的坐标为:x = 4,y = 4;Q点的坐标为:x =10,y = 7。用x和y值代入直线方程y = a + bx,得:

解之,得:

因此得直线方程:

(3)平均数法。把散点图上的点子分成两组,以中心点G(数=)为界,G不属任何组。这样,就可通过计算两个平均数来求回归直线方程式。

例:设x数列和y数列如表10-15所示。

表10-15 x数列和y数列表 x 0 1 3 5 6 6 7 9 11 12

13 15 y 0 2 3 6 9 8 7 9 9

10 10 12

7个点的 中心点C的左边有7个点,这7个点的

则左边7个点的代表点的坐标为(4,5)。

中心点G的右边有5个点,这5个点的这5个点的

则右边5个点的代表点的坐标为(12,10)。

用两个代表点的坐标,便可求出的值:

由此可得直线回归方程:y=2.5 + 0.625x

3.计算相关系数, 说明预测结果的可靠程度

相关系数更确切地概括地表明自变量对因变量的相关程度。如两者关系密切,则预测结果的可靠性越高;两者关系不密切,则预测结果不很可靠。因此,计算相关系数,可以间接地说明预测结果的可靠程度。

相关系数介于-1与+1之间,计算结果为正数表示正相关,负数表示负相关。其相关程度的一般规定,已在上面作过介绍。

4.利用回归方程进行预测

通过理论分析和相关系数,如果预测对象(因变量)与影响因素(自变量)之间,确实存在着显著的相关关系,那么过去和现在的数据规律,能延续到未来,也就是说,因变量和自变量之间的数量关系,能够反映未来的情况。同时,对影响因素(自变量)的情况已作过调查或预测,掌握了自变量在预测期的数据。这样,就可把自变量的数据代入回归预测方程, 求得预测对象(因变量)的预测值。

5.对预测作出置信区间的估计

用回归方程计算出来的预测值,是一个具体的数,称为点预测。点预测值是一个平均数,实际值可能高于或低于它,还必须用一定的机率保证其置信区间的范围。

为了计算置信区间,就要计算预测值的标准误差。其计算公式如下:

式中:S——标准差;

y——因变量的实际值;

——因变量的估计值,即回归方程的计算值:

n——数据个数;

n-2——自由度。因为只用x、y两个变量,故减2:

x----自变量;

——自变量的平均值;

——需要计算置信区间的预测点。

式中第一个因素

调整预测中

很大,而的离差程度(即为考虑自由度后的标准差;第二个因素是之差)的。如果确定回归方程的数据个数n接近,第二个因素就会接近于1。S就等于第一个因素。但是,如

与相距较远,式中第二个因素会大于l。预测值的标准果n很小,或预测点误差就比第一个因素大得多。

根据概率论证明,在数据较多时置信区间为:

置信度为68.3%;

置信度为95.45%;

置信度为99.7%。

扩大置信区间,可以增加预测的可靠程度;但如果置信区间很宽,就会使预测结果没有多大意义。

四、回归预测法举例 (一)线性回归预测

这里举三元线性回归预测的例子如下: 设有表10-17资料:

表10-17 三元线性回归资料

时 间

4.1 4.5 3.7 3.6 5.4 5.1 3.2 3.9 4.5 4.22

2.6 2.8 2.4 2.4 2.7 2.5 2.0 2.6 2.8 2.53

3.8 4.0 3.6 3.3 3.8 3.7 3.0 3.7 4.2 3.68

1 5.1 2 5.5 3 4.8 4 4.6 5 5.2 6 5.0 7 4.3 8 4.9 9 5.7 合计 5.01

表中,为因变量;为自变量。

可建立三元线性回归方程:

式中有4个参数:需建立4个标准方程式:

若用手工计算,可采用简化计算。即各项不用绝对值而用各项对其算术平均数之差。令

表10-18 计算表

时间

列于表10-18、表10-19:

1

0.09 2 0.49 3

-0.21 4 -0.41 5 0.19 6 -0.01 7 -0.71 8 -0.11 9 0.69

-0.12 0.28 -0.52 -0.62 1.18 0.88 -1.02 -0.32 0.28 0

0.07 0.27 -0.13 -0.13 0.17 -0.03 -0.53 0.07 0.27 0 0.12 0.32 -0.08 -0.38 0.12 0.02 -0.68 0.02 0.52 0

表10-19 计算表

时间 1 2 3 4 5 6 7 8 9

0.0081 0.0144 0.0049 0.0144 0.2401 0.0784 0.0729 0.1024 0.0441 0.2704 0.0169 0.0064 0.1681 0.3844 0.0169 0.1444 0.0361 1.3924 0.0289 0.0144 0.0001 0.7744 0.0009 0.0004 0.5041 1.0404 0.2809 0.4624 0.121 0.1024 0.0049 0.0004 0.4761 0.0784 0.0729 0.2704 1.4889 4.1356 0.5001 1.0156

从表10-18、表10-19资料知,

述4个标准方程式,可简化为三个方程式:

都等于零,于是上

将方程式中的各项除以n,并用

表示:

则上列三式可用以上符号表示:

根据表10-18、表10-19资料列表10-20计算:

表10-20 资料表

1 -0.0108 0.0063 0.0108 -0.0084 -0.0144 0.0084 2 0.1372 0.1323 0.1558 0.0756 0.0896 0.0864

3 0.1092 0.0273

0.0168 0.0676 0.0416 0.0104 4 0.2542 0.0533 0.1558 0.0806

0.2356 0.0494 5 0.2242 0.0323 0.0228 0.2006 0.1416 0.0204 6 -0.0088

0.0003 -0.0004 -0.0264 0.0176 -0.0006 7 -0.7242 0.3763 0.4828 0.5406 0.6036 0.3604 8

0.0352 -0.0077 -0.3588 -0.0224 -0.0064 0.0014 9 0.1932 0.1863

0.3588 0.0754 0.1456 0.1404

1.6578 0.8067 1.2020 0.9834 1.3444 0.6766 平

0.1842 0.0896 0.1336 0.1093 0.1494 0.0752 均

根据表10-20资料得:

代入联立方程组

解方程组得:

代入三元线性回归方程:

根据此式预测时,先要调查或预测自变量的数据,本例如果已测得第10期的

(二)曲线回归预测

则第10期

的预测值为:

例:某商店有关资料如表10-21。

表10-21 某商店商品零售额和流通费水平资料

商品零售 流通费

商品零售 流通费 额(万元) 水平(%) 额(万元) 水平(%)

x y x y 9.5 6.0 19.5 2.5 11.5 4.6 21.5 2.4 13.5 4.0 23.5 2.3 15.3 3.2 25.5 2.2 17.5 2.8 27.5 2.1

将表10-21资料绘制散点图10-6,以观察商品流通费水平与商品零售额之

间的关系。

从图上观察,随着商品零售额的增加,商品流通费水平就逐渐减少,呈双曲线形状。因此,可以用双曲线来描述两者之间的关系以及它们之间的数量变化规律,并预测未来。

双曲线方程:

为了求双曲线方程中两参数,先将曲线方程化为直线方程,故令

则:

然后采用最小平方法进行计算,如表10-22。

表10-22 双曲线回归方程预测计算表

商品流通

费水 平(%)y

9.5 0.105 6.0 0.01103 0.63 36.00 11.5 1.087 4.6 0.00756 0.40 21.16 13.5 0.074 4.0 0.00549 0.30 16.00 15.5 0.065 3.2 0.00416 0.21 10.24 17.5 0.057 2.8 0.00327 0.16 7.84 19.5 0.051 2.5 0.00263 0.13 6.25 21.5 0.047 2.4 0.00216 0.11 5.76 23.5 0.043 2.3 0.00181 0.10 5.29 25.5 0.039 2.2 0.00154 0.09 4.84 27.5 0.036 2.1 0.00132 0.08 4.41

0.04097 2.21 117.79 0.604 32.1 商品

零售额

(x)

将表列资料代入最小平方法的标准联立方程组:

解方程组得:

则为预测方程。

利用这个双曲线回归预测公式预测未来的流通费水平之前,还要用过去的资料计算流通费水平的理论值(%), 观察其与实际值误差的大小;计算相关系数,

观察该商店流通费水平与商品零售额之间相关关系的密切程度,预测未来商品零售额,以便代入公式对未来的流通费水平进行预测。 计算方法如表10-23。

表l0-23 相关系数及预测误差计算表

流通费水

平 误差 理论

值 (%)

9.5 6.0 36.00 5.92 0.08 0.0064

11.5 4.6 21.16 4.82 -0.22 0.0484 13.5 4.0 16.00 4.04 -0.04 0.0016 15.5 3.2 10.24 3.46 -0.26 0.0676 17.5 2.8 7.84 3.01 -0.21 0.0441 19.5 2.5 6.25 2.66 -0.16 0.0256 21.5 2.4 5.76 2.37 0.03 0.0009 23.5 2.3 5.29 2.13 0.17 0.0289 25.5 2.2 4.84 1.93 0.27 0.0729 27.5 2.1 4.41 1.76 0.34 0.1156

117.79 32.10 -- 0.4120 32.1

商品

流通零售

水平

(

(%)y 元)x

计算相关系数,可用以下公式:

式中,为实际值与理论值的离差平方的平均数。

为实际值与y的平均数的离差平方的平均数。

由于商品零售额增加,流通费水平则下降,所以两者是负相关,相关系数为(-0.986),故为高度相关。因此用此式预测比较可靠。

如果已知该店下期的商品零售额为27万元,以之代入预测式,则流通费水平下期的预测值为:

本例也可用以下双曲线公式描述并预测未来。

所计算出来的y=2.02(%)

由于所采用的双曲线公式不同,因此所得结果也就不同。究竟采用哪个公式,则可计算平均误差或平均平方误差进行比较,择优采用。 (三)自身回归预测

自身回归预测是从同一变量在不同周期中各个变量值之间的

相关关系,建立一元或多元回归方程进行预测。

在经济自身回归预测中,一般用向后推移一期或两期的一元线性自身回归。因为二元以上的自身回归计算复杂,并不能提高预测准确麈,用处不大。

例:某果树园历年苹果产量资料如表10-24所示。

表10-24为11项时间数列,假定用错后两期求自身回归,可有9对数值。依最小平方法求一元线性回归预测方程的参数。

表10-24 某果树园历年苹果产量

苹果产错后两年 别量 年

t

(

百千

克)x

1 218 2 360 218 3 300 360 4 520 300 5 460 520 6 580 460 7 520 580 8 640 520 9 600 640 10 680 600 11 620

计 算

65400 47524 187200 129600 138000 90000 301600 270400 239200 211600 371200 336400 312000 270400 435200 409600 372000 360000

4920 4198 2421800 2125524

一元线性自身回归预测方程为:

在错后两期的自身回归中,只能从t,即

第12年的产量。

(百千克),只能预测即

当t=11时,(百千克),可以预测第13年,即的产量。

回归预测法,是分析因变量与自变量之间相互关系,用回归方程表示,根据自变量的数值变化,去预测因变量数值变化的方法。

在经济预测中,人们把预测对象当作因变量,把那些与预测对象有关的因素当作自变量,收集自变量的充分数据,应用相关分析和回归分析求得回归方程,并利用回归方程进行预测。 回归预测法中的自变量,与时间序列预测法中的自变量不相同。后者的自变量是时间本身,而前者的自变量不是时间本身,而是其他的变量。

回归预测法中的自变量与因变量之间,有的属于因果关系,有的屑于伴随关系。不能认为只有因果关系才能进行回归预测,实际上伴随关系也是一种相关关系,只要收集大量的足够的资料,也可以用回归预测法进行预测。

在回归预测法中,自变量不是随机的或者是给定的,这与相关分析中自变量有所区别。相关分析中的自变量是随机的。

二、回归预测法的条件

在作回归预测时必须注意下列几个问题,这些问题是提高预测准确度的条件。

(1)经济现象之间, 即作为因变量与自变量之间必须有关系。怎样剖析两者有相关关系呢?从根本上说,只有通过马克思主义政治经济学的理论分析,才能正确作出判断,正确认识经济

现象之间的内在的必然联系和外部的偶然联系,不为假相关所迷惑。因此,切不可轻视理论分析而草率运用回归预测法。

(2)因变量与自变量之间的关系必须密切, 要有强相关,而自变量与另一个自变量之间的关系,必须不密切,要求弱相关或零相关。

判断相关关系密切程度的方法,可以通过绘制相关图和计算相关系数。根据历史资料绘制的相关图能判断相关的类型。相关图的类型如有以下几种。

①零相关图。当自变量x与因变量y没有相关关系,称为零相关,如图10-1。

②强正相关图。当自变量x增大时, 因变量y亦随之增大,点子的分布集中,呈直线形。故两者有强相关。如图10-2。

③弱正相关图。 当自变量x的数值增大时,y的数值也增大,但点子的分布不集中,两者之间仅有一定相关关系,称弱正相关。如图10-3。

④强负相关图。当自变量x增大时,因变量y亦随之减少,点子的分布集中呈直线形, 两者之间有强烈的相关关系,称强负相关。如图10-4。

⑤弱负相关图。当自变量x增大时,因变量y随之减少,点子的分布分散不集中,两者之间仅有一定的相关关系,称弱负相关。如图10-5。

相关系数也能从数量上说明相关的密切程度,一般规定: ︱r︱在0.3以下——无相关;

︱r︱在0.3~0.5——低度相关;

︱r︱在0.5~0.——显著相关;

︱r︱在0.8以上——高度相关。

(3)自变量的预测值必须比因变量的预测值精确或容易求得。 因为预测因变量的未来情况,必须有自变量的未来数据代入回归方程式才能计算出来。如果自变量的预测值更难求得,那么,该回归方程的应用价值就不大了。

(4)要正确地选择回归方程的形式。 亦即选择因变量和自变量的关系式是直线方程式还是曲线方程式;是一个自变量还是几个自变量。另外,还要注意计算简便,易于掌握。

(5)要有简单而又有效的验证方法。

三、回归预测法的种类和步骤

(一)回归预测法的种类

1.一元回归预测。

一元回归预测就是用相关分析法分析一个自变量和一个因变量之间的相关关系,利用一元回归方程式进行预测。例如,从居民货币收入预测某种耐用消费品的销售量;从工人劳动生产率预测利润额;从施肥量预测某种农作物的收获率等等。

2.多元回归预测。

多元回归预测就是分析一个因变量与若干个自变量的相关关系,建立多元回归方程,从若干自变量的变化去预测一个因变量的变化程度和未来的数量状况。例如,从施肥量、气温、降雨

量去预测某种农作物的收获率;从商业企业的职工劳动生产率和流通费率去预测利润率等等。

3.自回归预测。

自回归预测就是用一个时间数列的因变量数列与向过去推移若干时期的一个或几个自变量数列进行预测。例如对按月编制的时间数列,用今年1~12月的数列作为因变量数列, 用以前某月至某月的数列作为自变量数列,计算其相关系数,建立回归方程进行预测。

从回归方程的类型看,还可分为线性回归方程预测和曲线回归方程预测两种。

(二)回归预测法的步骤

回归预测法的步骤并不是固定不变的,而是非常灵活的。一般有以下几个步骤:

1.筛选自变量

首先,分析各自变量与因变量之间的相关关系,观察其相关关系的表现形式及密切程度。选用那些与因变量关系最为密切的自变量。在用多元回归预测时,还要分析各自变量之间的相关关系,选用那些关系不密切的自变量。如有两个自变量相互关系很密切,则应舍弃其中的一个。

2.确定回归方程式

根据理论分析和相关分析,如果有几个重要因素同时对预测对象有影响作用,而且关系密切,可以确定用多元回归方程式;如果其中某一个是基本的,起决定作用的,而其他因素影响作用不大或相关关系不密切,则可以确定用一元回归方程式进行预测。如果自变量和因变量之间的数据分布是线性趋势,可确定用直线回归方程;如果是曲线趋势,可确定用曲线回归方程。回归方程式确定以后,就要求回归方程中未知参数。当参数和自变量的预测值求出后,这个回归方程就可作为从自变量去预测因变量的预测公式。

求回归方程式中参数值的方法很多,上面曾经介绍过最小平

方法,这里不再赘述。只另外介绍一下求一元直线回归方程中参数

(1)两点法。

例如已知直线上两点:P点和Q点的坐标:P点为(4,4),Q点为(10,7),则 的简单方法。

得直线回归方程:

(2)解联立方程组法。因为直线上的任何一点都有一对满足直线方程式的坐标。如上例:P点的坐标为:x = 4,y = 4;Q点的坐标为:x =10,y = 7。用x和y值代入直线方程y = a + bx,得:

解之,得:

因此得直线方程:

(3)平均数法。把散点图上的点子分成两组,以中心点G(数=)为界,G不属任何组。这样,就可通过计算两个平均数来求回归直线方程式。

例:设x数列和y数列如表10-15所示。

表10-15 x数列和y数列表 x 0 1 3 5 6 6 7 9 11 12

13 15 y 0 2 3 6 9 8 7 9 9

10 10 12

7个点的 中心点C的左边有7个点,这7个点的

则左边7个点的代表点的坐标为(4,5)。

中心点G的右边有5个点,这5个点的这5个点的

则右边5个点的代表点的坐标为(12,10)。

用两个代表点的坐标,便可求出的值:

由此可得直线回归方程:y=2.5 + 0.625x

3.计算相关系数, 说明预测结果的可靠程度

相关系数更确切地概括地表明自变量对因变量的相关程度。如两者关系密切,则预测结果的可靠性越高;两者关系不密切,则预测结果不很可靠。因此,计算相关系数,可以间接地说明预测结果的可靠程度。

相关系数介于-1与+1之间,计算结果为正数表示正相关,负数表示负相关。其相关程度的一般规定,已在上面作过介绍。

4.利用回归方程进行预测

通过理论分析和相关系数,如果预测对象(因变量)与影响因素(自变量)之间,确实存在着显著的相关关系,那么过去和现在的数据规律,能延续到未来,也就是说,因变量和自变量之间的数量关系,能够反映未来的情况。同时,对影响因素(自变量)的情况已作过调查或预测,掌握了自变量在预测期的数据。这样,就可把自变量的数据代入回归预测方程, 求得预测对象(因变量)的预测值。

5.对预测作出置信区间的估计

用回归方程计算出来的预测值,是一个具体的数,称为点预测。点预测值是一个平均数,实际值可能高于或低于它,还必须用一定的机率保证其置信区间的范围。

为了计算置信区间,就要计算预测值的标准误差。其计算公式如下:

式中:S——标准差;

y——因变量的实际值;

——因变量的估计值,即回归方程的计算值:

n——数据个数;

n-2——自由度。因为只用x、y两个变量,故减2:

x----自变量;

——自变量的平均值;

——需要计算置信区间的预测点。

式中第一个因素

调整预测中

很大,而的离差程度(即为考虑自由度后的标准差;第二个因素是之差)的。如果确定回归方程的数据个数n接近,第二个因素就会接近于1。S就等于第一个因素。但是,如

与相距较远,式中第二个因素会大于l。预测值的标准果n很小,或预测点误差就比第一个因素大得多。

根据概率论证明,在数据较多时置信区间为:

置信度为68.3%;

置信度为95.45%;

置信度为99.7%。

扩大置信区间,可以增加预测的可靠程度;但如果置信区间很宽,就会使预测结果没有多大意义。

四、回归预测法举例 (一)线性回归预测

这里举三元线性回归预测的例子如下: 设有表10-17资料:

表10-17 三元线性回归资料

时 间

4.1 4.5 3.7 3.6 5.4 5.1 3.2 3.9 4.5 4.22

2.6 2.8 2.4 2.4 2.7 2.5 2.0 2.6 2.8 2.53

3.8 4.0 3.6 3.3 3.8 3.7 3.0 3.7 4.2 3.68

1 5.1 2 5.5 3 4.8 4 4.6 5 5.2 6 5.0 7 4.3 8 4.9 9 5.7 合计 5.01

表中,为因变量;为自变量。

可建立三元线性回归方程:

式中有4个参数:需建立4个标准方程式:

若用手工计算,可采用简化计算。即各项不用绝对值而用各项对其算术平均数之差。令

表10-18 计算表

时间

列于表10-18、表10-19:

1

0.09 2 0.49 3

-0.21 4 -0.41 5 0.19 6 -0.01 7 -0.71 8 -0.11 9 0.69

-0.12 0.28 -0.52 -0.62 1.18 0.88 -1.02 -0.32 0.28 0

0.07 0.27 -0.13 -0.13 0.17 -0.03 -0.53 0.07 0.27 0 0.12 0.32 -0.08 -0.38 0.12 0.02 -0.68 0.02 0.52 0

表10-19 计算表

时间 1 2 3 4 5 6 7 8 9

0.0081 0.0144 0.0049 0.0144 0.2401 0.0784 0.0729 0.1024 0.0441 0.2704 0.0169 0.0064 0.1681 0.3844 0.0169 0.1444 0.0361 1.3924 0.0289 0.0144 0.0001 0.7744 0.0009 0.0004 0.5041 1.0404 0.2809 0.4624 0.121 0.1024 0.0049 0.0004 0.4761 0.0784 0.0729 0.2704 1.4889 4.1356 0.5001 1.0156

从表10-18、表10-19资料知,

述4个标准方程式,可简化为三个方程式:

都等于零,于是上

将方程式中的各项除以n,并用

表示:

则上列三式可用以上符号表示:

根据表10-18、表10-19资料列表10-20计算:

表10-20 资料表

1 -0.0108 0.0063 0.0108 -0.0084 -0.0144 0.0084 2 0.1372 0.1323 0.1558 0.0756 0.0896 0.0864

3 0.1092 0.0273

0.0168 0.0676 0.0416 0.0104 4 0.2542 0.0533 0.1558 0.0806

0.2356 0.0494 5 0.2242 0.0323 0.0228 0.2006 0.1416 0.0204 6 -0.0088

0.0003 -0.0004 -0.0264 0.0176 -0.0006 7 -0.7242 0.3763 0.4828 0.5406 0.6036 0.3604 8

0.0352 -0.0077 -0.3588 -0.0224 -0.0064 0.0014 9 0.1932 0.1863

0.3588 0.0754 0.1456 0.1404

1.6578 0.8067 1.2020 0.9834 1.3444 0.6766 平

0.1842 0.0896 0.1336 0.1093 0.1494 0.0752 均

根据表10-20资料得:

代入联立方程组

解方程组得:

代入三元线性回归方程:

根据此式预测时,先要调查或预测自变量的数据,本例如果已测得第10期的

(二)曲线回归预测

则第10期

的预测值为:

例:某商店有关资料如表10-21。

表10-21 某商店商品零售额和流通费水平资料

商品零售 流通费

商品零售 流通费 额(万元) 水平(%) 额(万元) 水平(%)

x y x y 9.5 6.0 19.5 2.5 11.5 4.6 21.5 2.4 13.5 4.0 23.5 2.3 15.3 3.2 25.5 2.2 17.5 2.8 27.5 2.1

将表10-21资料绘制散点图10-6,以观察商品流通费水平与商品零售额之

间的关系。

从图上观察,随着商品零售额的增加,商品流通费水平就逐渐减少,呈双曲线形状。因此,可以用双曲线来描述两者之间的关系以及它们之间的数量变化规律,并预测未来。

双曲线方程:

为了求双曲线方程中两参数,先将曲线方程化为直线方程,故令

则:

然后采用最小平方法进行计算,如表10-22。

表10-22 双曲线回归方程预测计算表

商品流通

费水 平(%)y

9.5 0.105 6.0 0.01103 0.63 36.00 11.5 1.087 4.6 0.00756 0.40 21.16 13.5 0.074 4.0 0.00549 0.30 16.00 15.5 0.065 3.2 0.00416 0.21 10.24 17.5 0.057 2.8 0.00327 0.16 7.84 19.5 0.051 2.5 0.00263 0.13 6.25 21.5 0.047 2.4 0.00216 0.11 5.76 23.5 0.043 2.3 0.00181 0.10 5.29 25.5 0.039 2.2 0.00154 0.09 4.84 27.5 0.036 2.1 0.00132 0.08 4.41

0.04097 2.21 117.79 0.604 32.1 商品

零售额

(x)

将表列资料代入最小平方法的标准联立方程组:

解方程组得:

则为预测方程。

利用这个双曲线回归预测公式预测未来的流通费水平之前,还要用过去的资料计算流通费水平的理论值(%), 观察其与实际值误差的大小;计算相关系数,

观察该商店流通费水平与商品零售额之间相关关系的密切程度,预测未来商品零售额,以便代入公式对未来的流通费水平进行预测。 计算方法如表10-23。

表l0-23 相关系数及预测误差计算表

流通费水

平 误差 理论

值 (%)

9.5 6.0 36.00 5.92 0.08 0.0064

11.5 4.6 21.16 4.82 -0.22 0.0484 13.5 4.0 16.00 4.04 -0.04 0.0016 15.5 3.2 10.24 3.46 -0.26 0.0676 17.5 2.8 7.84 3.01 -0.21 0.0441 19.5 2.5 6.25 2.66 -0.16 0.0256 21.5 2.4 5.76 2.37 0.03 0.0009 23.5 2.3 5.29 2.13 0.17 0.0289 25.5 2.2 4.84 1.93 0.27 0.0729 27.5 2.1 4.41 1.76 0.34 0.1156

117.79 32.10 -- 0.4120 32.1

商品

流通零售

水平

(

(%)y 元)x

计算相关系数,可用以下公式:

式中,为实际值与理论值的离差平方的平均数。

为实际值与y的平均数的离差平方的平均数。

由于商品零售额增加,流通费水平则下降,所以两者是负相关,相关系数为(-0.986),故为高度相关。因此用此式预测比较可靠。

如果已知该店下期的商品零售额为27万元,以之代入预测式,则流通费水平下期的预测值为:

本例也可用以下双曲线公式描述并预测未来。

所计算出来的y=2.02(%)

由于所采用的双曲线公式不同,因此所得结果也就不同。究竟采用哪个公式,则可计算平均误差或平均平方误差进行比较,择优采用。 (三)自身回归预测

自身回归预测是从同一变量在不同周期中各个变量值之间的

相关关系,建立一元或多元回归方程进行预测。

在经济自身回归预测中,一般用向后推移一期或两期的一元线性自身回归。因为二元以上的自身回归计算复杂,并不能提高预测准确麈,用处不大。

例:某果树园历年苹果产量资料如表10-24所示。

表10-24为11项时间数列,假定用错后两期求自身回归,可有9对数值。依最小平方法求一元线性回归预测方程的参数。

表10-24 某果树园历年苹果产量

苹果产错后两年 别量 年

t

(

百千

克)x

1 218 2 360 218 3 300 360 4 520 300 5 460 520 6 580 460 7 520 580 8 640 520 9 600 640 10 680 600 11 620

计 算

65400 47524 187200 129600 138000 90000 301600 270400 239200 211600 371200 336400 312000 270400 435200 409600 372000 360000

4920 4198 2421800 2125524

一元线性自身回归预测方程为:

在错后两期的自身回归中,只能从t,即

第12年的产量。

(百千克),只能预测即

当t=11时,(百千克),可以预测第13年,即的产量。


相关内容

  • 多元线性回归分析预测法
  • 多元线性回归分析预测法 (重定向自多元线性回归预测法) 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一 ...

  • 经济预测与决策实验报告-副本
  • 重 庆 交 通 大 学 学 生 实 验 报 告 实验课程名称 经济预测与决策上机实验报告 开课实验室 学 院 管理学院 年级 09级 专业班 工商管理2班 学 生 姓 名 杨乐晨 学 号 09040229 开 课 时 间 经济预测与决策实验报告 实验一 实验名称:一元线性回归预测上机实验. 实验目的 ...

  • 多元回归分析的逐步回归预测模型
  • 摘 要: 回归分析方法是多元统计分析的各方法中应用最广泛的一种,也是数理统计中最成熟最常用的方法,主要是研究变量间的相互依赖关系.本文对多元线形回归模型的逐步回归,最优模型的检验.评价及预测作出了讨论. 关键词: 多元线形回归模型 逐步回归 最优模型 回归分析是一种古典又充满生机的模型,是数理统计中 ...

  • 偏最小二乘法基本知识
  • 偏最小二乘法(PLS )简介-数理统计 偏最小二乘法partial least square method是一种新型的多元统计数据分析方法,它于1983年由伍德(S.Wold)和阿巴诺(C.Albano)等人首次提出.近几十年来,它在理论.方法和应用方面都得到了迅速的发展. 偏最小二乘法 长期以来, ...

  • 电力系统中长期负荷预测方法的研究
  • 电力系统中长期负荷预测方法的研究与程序设计 摘要:本文在探讨了电力系统负荷的组成.特点,并分析比较了常用的预测方法优缺点的基础之上,采用了灰色预测法与回归法相结合的方法建立了中长期负荷预测模型,把负荷预测工作分为两部分:即用灰色预测法进行相关因素的预测和用回归法进行负荷预测.充分利用了灰色预测的要求 ...

  • 安徽省人口总数的预测
  • 统 计 预 测 和 决 策 课 程 论 文 -------------------安徽省人口总数的预测 学 院: 数理学院 班 级: 学生姓名 : 指导教师: 完成时间: 目 录 摘要„„„„„„„„„„„„„„„„„„„„„„„„2 一 绪论„„„„„„„„„„„„„„„„„„„„„„„3 二 数 ...

  • 基于Logistic回归分析模型的足球彩票预测方法
  • 基于Logistic回归分析模型的足球彩票预测方法 摘要:本文收集了2010年-2011年意大利足球甲级联赛前30场比赛中得分.积分.主客场情况.净胜球数等数据,首先对数据做主成分分析,剔除影响不显著的变量,然后运用多分类Logistic回归方法,建立Logistic回归模型,预测比赛结果.结果显示 ...

  • 我国工业废水排放量多元线性
  • 第10卷第3期 2011年6月 江南大学学报(自然科学版) JournalofJiangnanUniversity(NaturalScienceEdition) V01.10NO.3 Jun.201l 我国工业废水排放量的多元非线性回归预测 李磊1'2, 滨150090) 潘慧玲1 (1.江南大学商 ...

  • 多元线性回归预测模型论文
  • 伊犁师范学院数学与统计学院 2012届本科毕业论文 摘要:本文以多元统计分析为理论基础,在对数据进行统计分析的基础上建立多元线 性回归模型并对未知量作出预测,为相关决策提供依据和参考.重点介绍了模型中参数的 估计和自变量的优化选择及简单应用举例. 关键词:统计学:线性回归:预测模型 ┊ ┊ 一.引言 ...