实验五 ARIMA 模型的概念和构造
一、实验目的
了解AR ,MA 以及ARIMA 模型的特点,了解三者之间的区别联系,以及AR 与MA 的转换,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。
二、基本概念
所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。
在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数(简称ACF ),偏自相关函数(简称PACF) 以及它们各自的相关图(即ACF 、PACF 相对于滞后长度描图)。对于一个序列 { Y t } 来说,它的第j 阶自相关系数(记作 ρ j ) 定义为它的j 阶自协方差除以它的方差,即 ρj = γj 0 ,它是关于j 的函数,因此我们也称之为自相关函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。
三、实验内容及要求
1、实验内容:
根据1991年1月~2005年1月我国货币供应量(广义货币M2)的月度时间数据来说明在Eviews3.1 软件中如何利用B-J 方法论建立合适的ARIMA (p,d,q )模型,并利用此模型进行数据的预测。
2、实验要求:
(1)深刻理解上述基本概念;
(2)思考:如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测;
(3)熟练掌握相关Eviews 操作。
四、实验指导
1、ARIMA 模型的识别
(1)导入数据
打开Eviews 软件,选择“File”菜单中的“New--Workfile”选项,出现“Workfile Range”对话框,在“Workfile frequency”框中选择“Monthly ”,在“Start date”和“End date”框中分别输入“1991:01”和“2005:01”,然后单击“OK”,选择“File”菜单中的“Import--Read Text-Lotus-Excel”选项,找到要导入的名为EX6.2.xls 的Excel 文档,单击“打开”出现“Excel Spreadsheet Import”对话框并在其中输入相关数据名称(M2),再单击“OK”完成数据导入。
(2)模型的识别
首先利用ADF 检验,确定d 值,判断M2序列为2阶非平稳过程(由于具体操作方法我们在第五章中予以说明,此处略),即d 的值为2,将两次差分后得到的平稳序列命名为W2;下面我们来看W2的自相关、偏自相关函数图。 打开W2序列,点击
“V iew”—“C orrelogram”菜单,会弹出如图5-1所示的窗口,
图5-1 自相关形式设定
我们选择滞后项数为36,然后点击“OK”,就得到了W2的自相关函数图和偏自相关函数图,如图5-2所示。
图5-2 W2自相关函数图和偏自相关函数图
从W2的自相关函数图和偏自相关函数图中我们可以看到,他们都是拖尾的,
因此可设
定为ARMA 过程。W2的自相关函数1-5阶都是显著的,并且从第6阶开始下降很大,数值也不太显著,因此我们先设定q 值为5。W2的偏自相关函数1-2阶都很显著,并且从第3阶开始下降很大,因此我们先设定 p 的值为2,于是对于序列W2,我们初步建立了ARMA(2,5)模型。
2、模型的估计
点击“Quick ”-“Estimate Equation ”,会弹出如图5-3所示的窗口,在“Equation Specification”空白栏中键入“ W2 C MA(1) MA(2) MA(3) MA(4) MA(5) AR(1) AR(2)”,在“Estimation Settings”中选择“LS-Least Squares(NLS and ARMA)”,然后“OK”,得到如图5-4所示的估计结果。
图5-3 回归方程设定
图5-4 ARMA(2,5)回归结果
可以看到,除常数项外,其它解释变量的系数估计值在15%的显著性水平下都是显著的。
3、模型的诊断
点击“V iew”—“R esidual test”—“Correlogram-Q-statistics”,在弹出的窗口中选择滞后阶数为36,点击“Ok”,就可以得到Q 统计量,此时为30.96,p 值为0.367,因此不能拒绝原假设,可以认为模型较好的拟合了数据。
我们再来看是否存在一个更好的模型。我们的做法是增加模型的滞后长度,然后根据信息值来判断。表5-1是我们试验的几个p, q值的AIC 信息值。
可以看到,根据AIC 信息值,我们应选择p=3、q=5或p=4、q=6,但是按照后者建立的模型中有的解释变量的系数估计值是不显著的,而按照前者建立的模型其解释变量的系数值都是显著的(如图5-5所示),因此我们最终建立的模型是ARMA(3,5)。
图5-5 ARMA(3,5)回归结果
4、模型的预测
点击“Forecast ”,会弹出如图5-6所示的窗口。在Eviews 中有两种预测方式:“Dynamic ”和“Static ”,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进
行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。我们首先用前者来估计2003年1月到2005年1月的W2,在“S ample range for forecast”空白栏中键入“2003:01 2005:01”(如图5-6所示),选择“D ynamic”,其他的一些选项诸如预测序列的名称、以及输出结果的形式等,我们可以根据目的自行选择,不再介绍,点击“OK”,得到如图5-7所示的预测结果。
图5-6 ARMA(3,5)模型预测设定
图5-7 Dynamic 预测方式结果
图中实线代表的是W2的预测值,两条虚线则提供了2倍标准差的置信区间。可以看到,正如我们在前面所讲的,随着预测时间的增长,预测值很快趋向于序列的均值(接近0)。图的右边列出的是评价预测的一些标准,如平均预测误差平方和的平方根(RMSE ),Theil 不相等系数及其分解。可以看到,Theil 不相等系数为0.82,表明模型的预测能力不太好,而对它的分解表明偏误比例很小,方差比例较大,说明实际序列的波动较大,而模拟序列的波动较小,这可能是由于预测时间过长。
下面我们再利用“Static ”方法来估计2004年1月~2005年1月的W2,(操作过程略),我们可以得到如图5-8所示的结果。从图中可以看到,“Static ”方法得到的预测值波动性要大;同时,方差比例的下降也表明较好的模拟了实际序列的波动 ,Theil
不相等系数为
0.62,其中协方差比例为0.70,表明模型的预测结果较理想。
图5-8 Static 预测方式结果
实验五 ARIMA 模型的概念和构造
一、实验目的
了解AR ,MA 以及ARIMA 模型的特点,了解三者之间的区别联系,以及AR 与MA 的转换,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。
二、基本概念
所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。
在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数(简称ACF ),偏自相关函数(简称PACF) 以及它们各自的相关图(即ACF 、PACF 相对于滞后长度描图)。对于一个序列 { Y t } 来说,它的第j 阶自相关系数(记作 ρ j ) 定义为它的j 阶自协方差除以它的方差,即 ρj = γj 0 ,它是关于j 的函数,因此我们也称之为自相关函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。
三、实验内容及要求
1、实验内容:
根据1991年1月~2005年1月我国货币供应量(广义货币M2)的月度时间数据来说明在Eviews3.1 软件中如何利用B-J 方法论建立合适的ARIMA (p,d,q )模型,并利用此模型进行数据的预测。
2、实验要求:
(1)深刻理解上述基本概念;
(2)思考:如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测;
(3)熟练掌握相关Eviews 操作。
四、实验指导
1、ARIMA 模型的识别
(1)导入数据
打开Eviews 软件,选择“File”菜单中的“New--Workfile”选项,出现“Workfile Range”对话框,在“Workfile frequency”框中选择“Monthly ”,在“Start date”和“End date”框中分别输入“1991:01”和“2005:01”,然后单击“OK”,选择“File”菜单中的“Import--Read Text-Lotus-Excel”选项,找到要导入的名为EX6.2.xls 的Excel 文档,单击“打开”出现“Excel Spreadsheet Import”对话框并在其中输入相关数据名称(M2),再单击“OK”完成数据导入。
(2)模型的识别
首先利用ADF 检验,确定d 值,判断M2序列为2阶非平稳过程(由于具体操作方法我们在第五章中予以说明,此处略),即d 的值为2,将两次差分后得到的平稳序列命名为W2;下面我们来看W2的自相关、偏自相关函数图。 打开W2序列,点击
“V iew”—“C orrelogram”菜单,会弹出如图5-1所示的窗口,
图5-1 自相关形式设定
我们选择滞后项数为36,然后点击“OK”,就得到了W2的自相关函数图和偏自相关函数图,如图5-2所示。
图5-2 W2自相关函数图和偏自相关函数图
从W2的自相关函数图和偏自相关函数图中我们可以看到,他们都是拖尾的,
因此可设
定为ARMA 过程。W2的自相关函数1-5阶都是显著的,并且从第6阶开始下降很大,数值也不太显著,因此我们先设定q 值为5。W2的偏自相关函数1-2阶都很显著,并且从第3阶开始下降很大,因此我们先设定 p 的值为2,于是对于序列W2,我们初步建立了ARMA(2,5)模型。
2、模型的估计
点击“Quick ”-“Estimate Equation ”,会弹出如图5-3所示的窗口,在“Equation Specification”空白栏中键入“ W2 C MA(1) MA(2) MA(3) MA(4) MA(5) AR(1) AR(2)”,在“Estimation Settings”中选择“LS-Least Squares(NLS and ARMA)”,然后“OK”,得到如图5-4所示的估计结果。
图5-3 回归方程设定
图5-4 ARMA(2,5)回归结果
可以看到,除常数项外,其它解释变量的系数估计值在15%的显著性水平下都是显著的。
3、模型的诊断
点击“V iew”—“R esidual test”—“Correlogram-Q-statistics”,在弹出的窗口中选择滞后阶数为36,点击“Ok”,就可以得到Q 统计量,此时为30.96,p 值为0.367,因此不能拒绝原假设,可以认为模型较好的拟合了数据。
我们再来看是否存在一个更好的模型。我们的做法是增加模型的滞后长度,然后根据信息值来判断。表5-1是我们试验的几个p, q值的AIC 信息值。
可以看到,根据AIC 信息值,我们应选择p=3、q=5或p=4、q=6,但是按照后者建立的模型中有的解释变量的系数估计值是不显著的,而按照前者建立的模型其解释变量的系数值都是显著的(如图5-5所示),因此我们最终建立的模型是ARMA(3,5)。
图5-5 ARMA(3,5)回归结果
4、模型的预测
点击“Forecast ”,会弹出如图5-6所示的窗口。在Eviews 中有两种预测方式:“Dynamic ”和“Static ”,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进
行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。我们首先用前者来估计2003年1月到2005年1月的W2,在“S ample range for forecast”空白栏中键入“2003:01 2005:01”(如图5-6所示),选择“D ynamic”,其他的一些选项诸如预测序列的名称、以及输出结果的形式等,我们可以根据目的自行选择,不再介绍,点击“OK”,得到如图5-7所示的预测结果。
图5-6 ARMA(3,5)模型预测设定
图5-7 Dynamic 预测方式结果
图中实线代表的是W2的预测值,两条虚线则提供了2倍标准差的置信区间。可以看到,正如我们在前面所讲的,随着预测时间的增长,预测值很快趋向于序列的均值(接近0)。图的右边列出的是评价预测的一些标准,如平均预测误差平方和的平方根(RMSE ),Theil 不相等系数及其分解。可以看到,Theil 不相等系数为0.82,表明模型的预测能力不太好,而对它的分解表明偏误比例很小,方差比例较大,说明实际序列的波动较大,而模拟序列的波动较小,这可能是由于预测时间过长。
下面我们再利用“Static ”方法来估计2004年1月~2005年1月的W2,(操作过程略),我们可以得到如图5-8所示的结果。从图中可以看到,“Static ”方法得到的预测值波动性要大;同时,方差比例的下降也表明较好的模拟了实际序列的波动 ,Theil
不相等系数为
0.62,其中协方差比例为0.70,表明模型的预测结果较理想。
图5-8 Static 预测方式结果