前面两期文章中我们为大家介绍了卷烟需求预测需要掌握的重点、公式以及实际案例。由于季节预测法较为复杂,没有进行详细说明,在本期我们进行单独介绍。
季节预测的含义我们已经介绍过,简单来说就是对受季节因素影响的时间序列进行预测。比如雪糕的销量数据,夏天卖的多一点,冬天就会少一点,明显与季节相关,具有这样特点的数据就可以使用季节预测法。
那季节预测的具体步骤又是如何进行的呢?下面我们就通过对全国卷烟销量预测的实例来一步一步说明季节预测的步骤。
1 数据准备 你会觉得这是废话,谁也知道需要数据!但是你知道需要什么样的数据吗?月度数据还是年度数据?两年的还是三年的?
首先看时间跨度,它与数据呈现的季节性变化相关。例如冰激凌销量在夏季最高,它的时间跨度就是季度,相应的周期就是4。粽子的销量在每年的农历5月份销量最高,相应的跨度是月度,它的周期就是12。而卷烟在每年春节期间的销量会显著增加,因此可以将卷烟的时间跨度看做以季度为单位,即周期为4,所需要的数据就是季度数据。
在实际的应用中,现在已经把“季”当成“周期”的代名词了,只要有周期效应的事件,都可以称为季节性变化。
再看序列长度,该如何证明一个序列具有季节性呢?当然你可以说农历五月粽子大卖这不是明摆着吗?但是科学的事情不能空口无凭,要拿出数据证明,只要看到实实在在的每年农历五月粽子大卖的数据,别人才会相信。
对于序列长度,也就是样本量,并没有具体的要求,经验上来说最少要3年以上。但是太长也会影响结果,需要经过不断检验测试才能获取最佳的样本量长度。
在这里我们就不进行样本量的验证工作了,直接拿5年的全国卷烟销售季度数据进行预测。
2 工具准备 SPSS、MATLAB、EVIEWS、STATA这些可以处理时间序列的软件我都没听说过,就只会用Excel,所以我们来看看在Excel中怎么计算吧。打开Excel、输入数据什么的就不用啰嗦了吧?
3 判断序列是否呈现季节性特征 输入序列后不要急,先要看看是不是真的具有季节性。从折线图中可以看到,每一年的第一季度销量最高,第二季度和第三季度分别下降和上升一点,到第四季度达到最低点,非常典型的季节因素,可以放心使用。
4 计算模型系数 既然存在季节性变化,只要找到季节性的规律就可以了。季节性规律就是通过季节指数实现的。但是一个序列里面不仅会有季节性,还可能会有趋势性,比如每年烟草销量增长5%就属于趋势性。
从烟草的年度销量数据中能够看到有明显的增长趋势,因此就需要计算季节指数和趋势值。(季节指数和趋势值有多种确定方法,由于篇幅关系,我们只介绍一种)
因为卷烟销售数据存在增长趋势,就要先把增长的规律找出来。从上图的增长率曲线来看,很接近一条直线,所以我们用直线拟合就能得到趋势规律。
根据下面平均趋势法的公式,可以拟合曲线和趋势值。这里的a和b都是预测模型的系数。
得到趋势值后,就要计算季节指数,既然称为“季节指数”当然不能包含趋势因素,所以要剔除趋势值。在Excel中直接将各季度销量除以趋势值即可得到各期季节指数。
各期季节指数是消除了趋势后的指数,并不是最终值。因为我们只需要得到四个季节指数就可以了,而不是每年的四个季节。下面我们计算同季度平均季节指数:
趋势值和季节指数计算完了,是不是可以带入模型公式进行预测了呢?别急,还有一点问题要处理。四个同季度的季节指数相加理论上等于400%,但是由于计算总会出现误差,因此需要校正。
有人问上图的结果不就是400%吗,难道还要校正?那是Excel里面自动给你四舍五入了,实际结果是399.99%。校正也非常容易,通过下面公式就会得到校正系数,上图的结果再乘以校正系数就得到最终的季节指数了。
现在,模型的系数才算计算完毕,代入下面的公式就可以进行预测了。公式中的a、b是前面计算趋势值时得到的系数,t代表时间,SI代表季节指数。
Y=(a+bt)SI=(6265.79+18.38t)SI
注意时间t可不是从零开始的,而是为了保证整个时间系数相加等于零而生成的一个系列数。如果时间序列是2010-2014,t的取值就是-2、-1、0、1、2,如果要预测2015年的话,t值就是3。如果以季度为单位的话,t值就取11。
5 对预测模型进行验证 下面我通过上面得到的模型来预测一下2015年第一季度的卷烟销量,再通过真实结果验证一下模型的误差率。
其中t=11,i=1,带入公式中计算:
Y=(6265.79+18.38×11)×114.00%=7373.49
2015年第一季度的实际销量是7197.1亿支,误差为2.45%,一般情况下5%以内属于合理范围,所以预测结果还算理想。
实际情况是2015年的卷烟销量出现了下降,而2010到2014年卷烟销量一直为正增长,所以在预测模型中就不会将下降的因素纳入,导致出现了预测值大于实际值的结果,这就是通过历史数据预测的缺点。
可以通过其它方法消除这样的问题,比如利用相关变量进行预测,因为相关变量可以将当前情况纳入分析,进而判断上升或下降的趋势。假设卷烟销量和GDP相关,如果GDP的增速下降的话,那么卷烟预测值就会下降,就能够修正只通过历史数据预测而形成的偏差。
从预测结果来看,单独的一种预测方法往往会出现偏差,因此在卷烟预测过程中,需要通过多种方法对预测结果进行调整,才能够得到较为准确的预测值。
前面两期文章中我们为大家介绍了卷烟需求预测需要掌握的重点、公式以及实际案例。由于季节预测法较为复杂,没有进行详细说明,在本期我们进行单独介绍。
季节预测的含义我们已经介绍过,简单来说就是对受季节因素影响的时间序列进行预测。比如雪糕的销量数据,夏天卖的多一点,冬天就会少一点,明显与季节相关,具有这样特点的数据就可以使用季节预测法。
那季节预测的具体步骤又是如何进行的呢?下面我们就通过对全国卷烟销量预测的实例来一步一步说明季节预测的步骤。
1 数据准备 你会觉得这是废话,谁也知道需要数据!但是你知道需要什么样的数据吗?月度数据还是年度数据?两年的还是三年的?
首先看时间跨度,它与数据呈现的季节性变化相关。例如冰激凌销量在夏季最高,它的时间跨度就是季度,相应的周期就是4。粽子的销量在每年的农历5月份销量最高,相应的跨度是月度,它的周期就是12。而卷烟在每年春节期间的销量会显著增加,因此可以将卷烟的时间跨度看做以季度为单位,即周期为4,所需要的数据就是季度数据。
在实际的应用中,现在已经把“季”当成“周期”的代名词了,只要有周期效应的事件,都可以称为季节性变化。
再看序列长度,该如何证明一个序列具有季节性呢?当然你可以说农历五月粽子大卖这不是明摆着吗?但是科学的事情不能空口无凭,要拿出数据证明,只要看到实实在在的每年农历五月粽子大卖的数据,别人才会相信。
对于序列长度,也就是样本量,并没有具体的要求,经验上来说最少要3年以上。但是太长也会影响结果,需要经过不断检验测试才能获取最佳的样本量长度。
在这里我们就不进行样本量的验证工作了,直接拿5年的全国卷烟销售季度数据进行预测。
2 工具准备 SPSS、MATLAB、EVIEWS、STATA这些可以处理时间序列的软件我都没听说过,就只会用Excel,所以我们来看看在Excel中怎么计算吧。打开Excel、输入数据什么的就不用啰嗦了吧?
3 判断序列是否呈现季节性特征 输入序列后不要急,先要看看是不是真的具有季节性。从折线图中可以看到,每一年的第一季度销量最高,第二季度和第三季度分别下降和上升一点,到第四季度达到最低点,非常典型的季节因素,可以放心使用。
4 计算模型系数 既然存在季节性变化,只要找到季节性的规律就可以了。季节性规律就是通过季节指数实现的。但是一个序列里面不仅会有季节性,还可能会有趋势性,比如每年烟草销量增长5%就属于趋势性。
从烟草的年度销量数据中能够看到有明显的增长趋势,因此就需要计算季节指数和趋势值。(季节指数和趋势值有多种确定方法,由于篇幅关系,我们只介绍一种)
因为卷烟销售数据存在增长趋势,就要先把增长的规律找出来。从上图的增长率曲线来看,很接近一条直线,所以我们用直线拟合就能得到趋势规律。
根据下面平均趋势法的公式,可以拟合曲线和趋势值。这里的a和b都是预测模型的系数。
得到趋势值后,就要计算季节指数,既然称为“季节指数”当然不能包含趋势因素,所以要剔除趋势值。在Excel中直接将各季度销量除以趋势值即可得到各期季节指数。
各期季节指数是消除了趋势后的指数,并不是最终值。因为我们只需要得到四个季节指数就可以了,而不是每年的四个季节。下面我们计算同季度平均季节指数:
趋势值和季节指数计算完了,是不是可以带入模型公式进行预测了呢?别急,还有一点问题要处理。四个同季度的季节指数相加理论上等于400%,但是由于计算总会出现误差,因此需要校正。
有人问上图的结果不就是400%吗,难道还要校正?那是Excel里面自动给你四舍五入了,实际结果是399.99%。校正也非常容易,通过下面公式就会得到校正系数,上图的结果再乘以校正系数就得到最终的季节指数了。
现在,模型的系数才算计算完毕,代入下面的公式就可以进行预测了。公式中的a、b是前面计算趋势值时得到的系数,t代表时间,SI代表季节指数。
Y=(a+bt)SI=(6265.79+18.38t)SI
注意时间t可不是从零开始的,而是为了保证整个时间系数相加等于零而生成的一个系列数。如果时间序列是2010-2014,t的取值就是-2、-1、0、1、2,如果要预测2015年的话,t值就是3。如果以季度为单位的话,t值就取11。
5 对预测模型进行验证 下面我通过上面得到的模型来预测一下2015年第一季度的卷烟销量,再通过真实结果验证一下模型的误差率。
其中t=11,i=1,带入公式中计算:
Y=(6265.79+18.38×11)×114.00%=7373.49
2015年第一季度的实际销量是7197.1亿支,误差为2.45%,一般情况下5%以内属于合理范围,所以预测结果还算理想。
实际情况是2015年的卷烟销量出现了下降,而2010到2014年卷烟销量一直为正增长,所以在预测模型中就不会将下降的因素纳入,导致出现了预测值大于实际值的结果,这就是通过历史数据预测的缺点。
可以通过其它方法消除这样的问题,比如利用相关变量进行预测,因为相关变量可以将当前情况纳入分析,进而判断上升或下降的趋势。假设卷烟销量和GDP相关,如果GDP的增速下降的话,那么卷烟预测值就会下降,就能够修正只通过历史数据预测而形成的偏差。
从预测结果来看,单独的一种预测方法往往会出现偏差,因此在卷烟预测过程中,需要通过多种方法对预测结果进行调整,才能够得到较为准确的预测值。