ARIMA模型的概念和构造

实验五 ARIMA 模型的概念和构造

一、实验目的

了解AR ,MA 以及ARIMA 模型的特点,了解三者之间的区别联系,以及AR 与MA 的转换,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。

二、基本概念

所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。

在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数(简称ACF ),偏自相关函数(简称PACF) 以及它们各自的相关图(即ACF 、PACF 相对于滞后长度描图)。对于一个序列 { Y t } 来说,它的第j 阶自相关系数(记作 ρ j ) 定义为它的j 阶自协方差除以它的方差,即 ρj = γj 0 ,它是关于j 的函数,因此我们也称之为自相关函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。

三、实验内容及要求

1、实验内容:

根据1991年1月~2005年1月我国货币供应量(广义货币M2)的月度时间数据来说明在Eviews3.1 软件中如何利用B-J 方法论建立合适的ARIMA (p,d,q )模型,并利用此模型进行数据的预测。

2、实验要求:

(1)深刻理解上述基本概念;

(2)思考:如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测;

(3)熟练掌握相关Eviews 操作。

四、实验指导

1、ARIMA 模型的识别

(1)导入数据

打开Eviews 软件,选择“File”菜单中的“New--Workfile”选项,出现“Workfile Range”对话框,在“Workfile frequency”框中选择“Monthly ”,在“Start date”和“End date”框中分别输入“1991:01”和“2005:01”,然后单击“OK”,选择“File”菜单中的“Import--Read Text-Lotus-Excel”选项,找到要导入的名为EX6.2.xls 的Excel 文档,单击“打开”出现“Excel Spreadsheet Import”对话框并在其中输入相关数据名称(M2),再单击“OK”完成数据导入。

(2)模型的识别

首先利用ADF 检验,确定d 值,判断M2序列为2阶非平稳过程(由于具体操作方法我们在第五章中予以说明,此处略),即d 的值为2,将两次差分后得到的平稳序列命名为W2;下面我们来看W2的自相关、偏自相关函数图。 打开W2序列,点击

“V iew”—“C orrelogram”菜单,会弹出如图5-1所示的窗口,

图5-1 自相关形式设定

我们选择滞后项数为36,然后点击“OK”,就得到了W2的自相关函数图和偏自相关函数图,如图5-2所示。

图5-2 W2自相关函数图和偏自相关函数图

从W2的自相关函数图和偏自相关函数图中我们可以看到,他们都是拖尾的,

因此可设

定为ARMA 过程。W2的自相关函数1-5阶都是显著的,并且从第6阶开始下降很大,数值也不太显著,因此我们先设定q 值为5。W2的偏自相关函数1-2阶都很显著,并且从第3阶开始下降很大,因此我们先设定 p 的值为2,于是对于序列W2,我们初步建立了ARMA(2,5)模型。

2、模型的估计

点击“Quick ”-“Estimate Equation ”,会弹出如图5-3所示的窗口,在“Equation Specification”空白栏中键入“ W2 C MA(1) MA(2) MA(3) MA(4) MA(5) AR(1) AR(2)”,在“Estimation Settings”中选择“LS-Least Squares(NLS and ARMA)”,然后“OK”,得到如图5-4所示的估计结果。

图5-3 回归方程设定

图5-4 ARMA(2,5)回归结果

可以看到,除常数项外,其它解释变量的系数估计值在15%的显著性水平下都是显著的。

3、模型的诊断

点击“V iew”—“R esidual test”—“Correlogram-Q-statistics”,在弹出的窗口中选择滞后阶数为36,点击“Ok”,就可以得到Q 统计量,此时为30.96,p 值为0.367,因此不能拒绝原假设,可以认为模型较好的拟合了数据。

我们再来看是否存在一个更好的模型。我们的做法是增加模型的滞后长度,然后根据信息值来判断。表5-1是我们试验的几个p, q值的AIC 信息值。

可以看到,根据AIC 信息值,我们应选择p=3、q=5或p=4、q=6,但是按照后者建立的模型中有的解释变量的系数估计值是不显著的,而按照前者建立的模型其解释变量的系数值都是显著的(如图5-5所示),因此我们最终建立的模型是ARMA(3,5)。

图5-5 ARMA(3,5)回归结果

4、模型的预测

点击“Forecast ”,会弹出如图5-6所示的窗口。在Eviews 中有两种预测方式:“Dynamic ”和“Static ”,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进

行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。我们首先用前者来估计2003年1月到2005年1月的W2,在“S ample range for forecast”空白栏中键入“2003:01 2005:01”(如图5-6所示),选择“D ynamic”,其他的一些选项诸如预测序列的名称、以及输出结果的形式等,我们可以根据目的自行选择,不再介绍,点击“OK”,得到如图5-7所示的预测结果。

图5-6 ARMA(3,5)模型预测设定

图5-7 Dynamic 预测方式结果

图中实线代表的是W2的预测值,两条虚线则提供了2倍标准差的置信区间。可以看到,正如我们在前面所讲的,随着预测时间的增长,预测值很快趋向于序列的均值(接近0)。图的右边列出的是评价预测的一些标准,如平均预测误差平方和的平方根(RMSE ),Theil 不相等系数及其分解。可以看到,Theil 不相等系数为0.82,表明模型的预测能力不太好,而对它的分解表明偏误比例很小,方差比例较大,说明实际序列的波动较大,而模拟序列的波动较小,这可能是由于预测时间过长。

下面我们再利用“Static ”方法来估计2004年1月~2005年1月的W2,(操作过程略),我们可以得到如图5-8所示的结果。从图中可以看到,“Static ”方法得到的预测值波动性要大;同时,方差比例的下降也表明较好的模拟了实际序列的波动 ,Theil

不相等系数为

0.62,其中协方差比例为0.70,表明模型的预测结果较理想。

图5-8 Static 预测方式结果

实验五 ARIMA 模型的概念和构造

一、实验目的

了解AR ,MA 以及ARIMA 模型的特点,了解三者之间的区别联系,以及AR 与MA 的转换,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。

二、基本概念

所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。

在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数(简称ACF ),偏自相关函数(简称PACF) 以及它们各自的相关图(即ACF 、PACF 相对于滞后长度描图)。对于一个序列 { Y t } 来说,它的第j 阶自相关系数(记作 ρ j ) 定义为它的j 阶自协方差除以它的方差,即 ρj = γj 0 ,它是关于j 的函数,因此我们也称之为自相关函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。

三、实验内容及要求

1、实验内容:

根据1991年1月~2005年1月我国货币供应量(广义货币M2)的月度时间数据来说明在Eviews3.1 软件中如何利用B-J 方法论建立合适的ARIMA (p,d,q )模型,并利用此模型进行数据的预测。

2、实验要求:

(1)深刻理解上述基本概念;

(2)思考:如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测;

(3)熟练掌握相关Eviews 操作。

四、实验指导

1、ARIMA 模型的识别

(1)导入数据

打开Eviews 软件,选择“File”菜单中的“New--Workfile”选项,出现“Workfile Range”对话框,在“Workfile frequency”框中选择“Monthly ”,在“Start date”和“End date”框中分别输入“1991:01”和“2005:01”,然后单击“OK”,选择“File”菜单中的“Import--Read Text-Lotus-Excel”选项,找到要导入的名为EX6.2.xls 的Excel 文档,单击“打开”出现“Excel Spreadsheet Import”对话框并在其中输入相关数据名称(M2),再单击“OK”完成数据导入。

(2)模型的识别

首先利用ADF 检验,确定d 值,判断M2序列为2阶非平稳过程(由于具体操作方法我们在第五章中予以说明,此处略),即d 的值为2,将两次差分后得到的平稳序列命名为W2;下面我们来看W2的自相关、偏自相关函数图。 打开W2序列,点击

“V iew”—“C orrelogram”菜单,会弹出如图5-1所示的窗口,

图5-1 自相关形式设定

我们选择滞后项数为36,然后点击“OK”,就得到了W2的自相关函数图和偏自相关函数图,如图5-2所示。

图5-2 W2自相关函数图和偏自相关函数图

从W2的自相关函数图和偏自相关函数图中我们可以看到,他们都是拖尾的,

因此可设

定为ARMA 过程。W2的自相关函数1-5阶都是显著的,并且从第6阶开始下降很大,数值也不太显著,因此我们先设定q 值为5。W2的偏自相关函数1-2阶都很显著,并且从第3阶开始下降很大,因此我们先设定 p 的值为2,于是对于序列W2,我们初步建立了ARMA(2,5)模型。

2、模型的估计

点击“Quick ”-“Estimate Equation ”,会弹出如图5-3所示的窗口,在“Equation Specification”空白栏中键入“ W2 C MA(1) MA(2) MA(3) MA(4) MA(5) AR(1) AR(2)”,在“Estimation Settings”中选择“LS-Least Squares(NLS and ARMA)”,然后“OK”,得到如图5-4所示的估计结果。

图5-3 回归方程设定

图5-4 ARMA(2,5)回归结果

可以看到,除常数项外,其它解释变量的系数估计值在15%的显著性水平下都是显著的。

3、模型的诊断

点击“V iew”—“R esidual test”—“Correlogram-Q-statistics”,在弹出的窗口中选择滞后阶数为36,点击“Ok”,就可以得到Q 统计量,此时为30.96,p 值为0.367,因此不能拒绝原假设,可以认为模型较好的拟合了数据。

我们再来看是否存在一个更好的模型。我们的做法是增加模型的滞后长度,然后根据信息值来判断。表5-1是我们试验的几个p, q值的AIC 信息值。

可以看到,根据AIC 信息值,我们应选择p=3、q=5或p=4、q=6,但是按照后者建立的模型中有的解释变量的系数估计值是不显著的,而按照前者建立的模型其解释变量的系数值都是显著的(如图5-5所示),因此我们最终建立的模型是ARMA(3,5)。

图5-5 ARMA(3,5)回归结果

4、模型的预测

点击“Forecast ”,会弹出如图5-6所示的窗口。在Eviews 中有两种预测方式:“Dynamic ”和“Static ”,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进

行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。我们首先用前者来估计2003年1月到2005年1月的W2,在“S ample range for forecast”空白栏中键入“2003:01 2005:01”(如图5-6所示),选择“D ynamic”,其他的一些选项诸如预测序列的名称、以及输出结果的形式等,我们可以根据目的自行选择,不再介绍,点击“OK”,得到如图5-7所示的预测结果。

图5-6 ARMA(3,5)模型预测设定

图5-7 Dynamic 预测方式结果

图中实线代表的是W2的预测值,两条虚线则提供了2倍标准差的置信区间。可以看到,正如我们在前面所讲的,随着预测时间的增长,预测值很快趋向于序列的均值(接近0)。图的右边列出的是评价预测的一些标准,如平均预测误差平方和的平方根(RMSE ),Theil 不相等系数及其分解。可以看到,Theil 不相等系数为0.82,表明模型的预测能力不太好,而对它的分解表明偏误比例很小,方差比例较大,说明实际序列的波动较大,而模拟序列的波动较小,这可能是由于预测时间过长。

下面我们再利用“Static ”方法来估计2004年1月~2005年1月的W2,(操作过程略),我们可以得到如图5-8所示的结果。从图中可以看到,“Static ”方法得到的预测值波动性要大;同时,方差比例的下降也表明较好的模拟了实际序列的波动 ,Theil

不相等系数为

0.62,其中协方差比例为0.70,表明模型的预测结果较理想。

图5-8 Static 预测方式结果


相关内容

  • 2011年全国大学生统计建模大赛论文二等奖第五名
  • 二重趋势时间序列的组合预测模型 广东外语外贸大学 陈文聪.庄文钿.苏玲 摘 要 时间序列预测是一个多学科交叉的研究领域,呈现趋势变动性和周期波动性的二重趋势时间序列更是经常出现在各种重要场合,建立有效模型对其准确预测尤为重要.本文基于二重趋势时间序列理论,以我国1992年-2010年各季度的国内生产 ...

  • (2011-0025)治安预测方法与技术比较研究2
  • 治安预测方法与技术比较研究 王 欣 (中国人民公安大学图书馆, 北京 102600) 摘要:治安预测是犯罪情报分析中重要的情报分析方法,是警方的日常警务工作中经常使用的工具,本文对国内外治安情报预测方法进行了广泛的研究,分析并总结了目前治安预测主要的技术和方法,比较了国外内治安预测研究的不同点,展望 ...

  • 金融时间序列分析
  • 第三章 1.差分计算 x=1:10 y=diff(x) k步差分∇kxt=xt-xt-k 加入参数 lag=k 如计算x的3步差分为 y=diff(x, lag = 3) p阶差分 ∇pxt=∇p-1xt-∇p-1xt-1 ∇2xt=∇xt-∇xt-1加入参数differences = p 如2阶差 ...

  • 目标企业产品销量的预测模型与分析
  • 2008年第3期(总第145期) 山东纺织经济 目标企业产品销量的预测模型与分析 大目吴蕾 (长春税务学院经济模拟研究所吉林长春 1:5011 7) 摘要:本文主要应用时间序列模型中的AEIMA模型.疏系数ARIMA模型和自回归.残差自回归几种模型,对目标空调企业1996-2007年的全国空调总销售 ...

  • 河南省消费者价格指数预测概述.
  • 基于ARIMA 和马尔科夫链模型的消费者价格指数 预测模型 摘 要 消费者价格指数(CPI ) 是表现通货膨胀的一项重要的经济指标.本文以2004年至2013年河南省居民消费者价格指数指标为历史数据,选用差分方法消除时间序列的非平稳性,创建ARIMA 模型,预测和分析了河南省CPI 数据.而后采用马 ...

  • 差分自回归移动平均模型在中国粮食产量预测...
  • 第36卷2011年第3期 GRAINSCIENCEANDTECHNOLOGYANDECONOMY 差分自回归移动平均模型在中国粮食产量预测中的应用 陈生,李夫明 (上海海事大学经济管理学院,上海 200135) [摘要]中国是个人口大国,每年对粮食的需求非常大,粮食产量能不能满足需求显得至关重要.因 ...

  • 时间序列模型在乌鲁木齐交通事故分析中的应用
  • [摘 要] 文章研究时间序列模型在乌鲁木齐月交通事故中的应用.分析了乌鲁木齐2007年1月至2013年12月的月交通事故数,建立一般时间序列ARIMA模型和季节时间序列SARIMA模型.结果表明剔除时间趋势和季节性的SARIMA(0,1,1)(0,1,1)12模型适合研究乌鲁木齐月交通事故数,利用模 ...

  • ARIMA-PSM时序自适应动态脉冲阶梯调制
  • 龙源期刊网 http://www.qikan.com.cn ARIMA -PSM 时序自适应动态脉冲阶梯调制 作者:梁雯 来源:<科技传播>2015年第07期 摘 要 PSM广播发射机技术已成熟并被广泛应用,通过数字处理技术调制音频信号.随着技术革新,许多其它技术也可以尝试应用在PSM ...

  • 我国固定资产投资总额的动态分析
  • 摘要 固定资产投资总额是影响一国经济增长的重要因素,对拉动国民经济的发展起着至关重要的作用.本文以我国固定资产投资总额为例,选取1982-2009年全社会固定资产投资总额的时间序列数据,利用Eviews软件对该数据进行计量分析,研究我国固定资产投资总额的变化趋势和特征,建立自回归移动平均模型即ARI ...