目录
指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测,其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律。用序列过去值的加权均值来预测将来的值,序列中近期的数据被赋以较大的权重,远期的数据被赋以较小的权重。理由是一般情况下,某一变量值对其后继行为的影响作用是逐渐衰减的。
1. 基础知识
1). 前提假设:时间序列分析一般假设我们获得的数据在时域上具有一定的相互依赖关系,例如股票价格在t时刻很高,那么在t+1时刻价格也会比较高(跌停才10%);如果股票价格在一段时间内获得稳定的上升,那么在接下来的一段时间内延续上升趋势的概率也会比较大。
2). 目标:(1)发现这种隐含的依赖关系,并增加我们对此类时间序列的理解;(2)对未观测到的或者尚未发生的时间序列进行预测。
我们认为时间序列由两部分组成:有规律的时间序列(即有依赖关系)+噪声(无规律,无依赖)。所以,接下来要做的就是过滤噪声—最简单的过滤噪声的方法是 取平均。
2. 简单滑动平均(rolling mean)
1). 特点:当窗口取得越长,噪声被去除的就越多,我们得到的信号就越平稳;但同时,信号的有用部分丢失原有特性的可能性就越大,而我们希望发现的规律丢失的可能性就越大。
2). 缺点:(1)我们要等到至少获得T个信号才能进行平均,那么得到的新的信号要比原始信号短;(2)在得到S_t的时候,我们只有距离t最近的T个原始信号。但在原始信号中,可能信号之间的相互依赖关系会跨越非常长的时间长度,比如X_1可能会对X_100会产生影响,这样滑动平均就会削弱甚至隐藏这种依赖关系。
3. 指数平均(EXPMA)
接下来介绍一种稍微复杂但能克服以上缺点并且在现实中应用也更加广泛的方法:指数平均 (exponential smoothing,也叫exponential weighted moving average ),这种平均方法的一个重要特征就是,S_t与之前产生的所有信号有关,并且距离越近的信号所占权重越大。
3.1 一阶指数平滑
一阶指数平滑实际就是对历史数据的加权平均,它可以用于任何一种没有明显函数规律但确实存在某种前后关联的时间序列的短期预测。其预测公式为:
或
- a:平滑系数
- yt+1':t+1期的预测值,即本期(t期)的平滑值St ;
- yt:t期的实际值;
- yt':t期的预测值,即上期的平滑值St-1 。本期的平滑值 = 下期的预测值
该公式又可以写作:
可见:下期预测值是本期预测值与以a为折扣的本期实际值与预测值误差之和。
1. 最突出的优点:方法非常简单,甚至只要样本末期的平滑值,就可以得到预测结果。
2. 一次指数平滑的特点是:能够跟踪数据变化。这一特点所有指数都具有。预测过程中添加最新的样本数据后,新数据应取代老数据的地位,老数据会逐渐居于次要的地位,直至被淘汰。这样,预测值总是反映最新的数据结构。
3. 一次指数平滑有局限性:第一,预测值不能反映趋势变动、季节波动等有规律的变动;第二,这种方法多适用于短期预测,而不适合作中长期的预测;第三,由于预测值是历史数据的均值,因此与实际序列的变化相比有滞后现象。
4. 平滑系数:指数平滑预测是否理想,很大程度上取决于平滑系数。指数平滑法对实际序列具有平滑作用,平滑系数a 越小,平滑作用越强,但对实际数据的变动反应较迟缓。
EViews提供两种确定指数平滑系数的方法:自动给定和人工确定。选择自动给定,系统将按照预测误差平方和最小原则自动确定系数。如果系数接近1,说明该序列近似纯随机序列,这时最新的观测值就是最理想的预测值。出于预测的考虑,有时系统给定的系数不是很理想,用户需要自己指定平滑系数值。一般来说:(1)如果序列变化比较平缓,平滑系数值应该比较小,比如小于0.1;(2)如果序列变化比较剧烈,平滑系数值可以取得大一些,如0.3~0.5。(3)若平滑系数值大于0.5才能跟上序列的变化,表明序列有很强的趋势,不能采用一次指数平滑进行预测。
5. 缺点:(1)只考虑历史平均,不考虑变化趋势;(2)在实际序列的线性变动部分,指数平滑值序列出现一定的滞后偏差,偏差程度随着平滑系数a 的增大而减少,但当时间序列的变动出现直线趋势时,用一次指数平滑法来进行预测仍将存在着明显的滞后偏差。因此,也需要进行修正。修正的方法也是在一次指数平滑的基础上再进行二次指数平滑,利用滞后偏差的规律找出曲线的发展方向和发展趋势,然后建立直线趋势预测模型,故称为二次指数平滑法。
3.2 二次指数平滑
二次指数平滑是对一次指数平滑的再平滑,同时考虑历史平均和变化趋势。它适用于具线性趋势的时间数列。
我们可以看到,虽然一次指数平均在产生新的数列的时候考虑了所有的历史数据,但是仅仅考虑其静态值,即没有考虑时间序列当前的变化趋势。如果当前的股票处于上升趋势,那么当我们对明天的股票进行预测的时候,好的预测值不仅仅是对历史数据进行”平均“,而且要考虑到当前数据变化的上升趋势。同时考虑历史平均和变化趋势,这便是二阶指数平均,公式:
式中,
也就是:
- :第t+T期预测值;
- T:由t期向后推移期数。
显然,二次指数平滑是一直线方程,其截距为:(2yt’-yt),斜率为:(yt’-yt) a/(1-a),自变量为预测天数。
在一次指数平滑的基础上得二次指数平滑 的计算公式为:
- :第t周期的二次指数平滑值;
- :第t周期的一次指数平滑值;
- :第t-1周期的二次指数平滑值;
- a :加权系数(也称为平滑系数)。
二次指数平滑法是对一次指数平滑值作再一次指数平滑的方法。它不能单独地进行预测,必须与一次指数平滑法配合,建立预测的数学模型,然后运用数学模型确定预测值。
3.3 三次指数平滑预测
1. 与前两种相比,我们多考虑一个因素:季节性效应( Seasonality)。这种平均模型考虑的季节性效应在股票或者期货价格中都会比较常见,比如在过年前A股市场通常会交易比较频繁,在小麦成熟的时候小麦期货价格也会有比较明显的波动。但是,模型本身的复杂度也增加了其使用难度,我们需要一定的经验才能比较合理地设置其中复杂的参数。
2. 三次指数平滑预测是二次平滑基础上的再平滑。 其预测公式是:
yt+m=(3yt’-3yt+yt)+[(6-5a)yt’-(10-8a)yt+(4-3a)yt]*am/2(1-a)2+ (yt’-2yt+yt’)*a2m2/2(1-a)2
式中,yt=ayt-1+(1-a)yt-1
它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权。
4. 二次指数平滑法实例分析
表中第③栏是我国1978-2002年全社会客运量的资料,据期绘制散点图,见下图,可以看出,各年的客运量资料基本呈线性趋势,但在几个不同的时期直线有不同的斜率,因此考虑用变参数线性趋势模型进行预测。具体步骤如下:
表4-1 我国1978-2002年全社会客运量及预测值 单位:万人
年份 | 时间t | 全社会客运量y | 各期的一次指数平滑值 | 各期的二次指数平滑值 | at | bt | |
---|---|---|---|---|---|---|---|
① | ② | ③ | ④ | ⑤ | ⑥ | ⑦ | ⑧ |
253993.0 | 253993.0 | ||||||
1978 | 1 | 253993 | 253993.0 | 253993.0 | 253993.0 | 0.0 | |
1979 | 2 | 289665 | 275396.2 | 266834.9 | 283957.5 | 12841.9 | 253993.0 |
1980 | 3 | 341785 | 315229.5 | 295871.7 | 334587.3 | 29036.7 | 296799.4 |
1981 | 4 | 384763 | 356949.6 | 332518.4 | 381380.8 | 36646.8 | 363624.0 |
1982 | 5 | 428964 | 400158.2 | 373102.3 | 427214.2 | 40583.9 | 418027.5 |
1983 | 6 | 470614 | 442431.7 | 414699.9 | 470163.4 | 41597.6 | 467798.1 |
1984 | 7 | 530217 | 495102.9 | 462941.7 | 527264.1 | 48241.8 | 511761.1 |
1985 | 8 | 620206 | 570164.8 | 527275.5 | 613054.0 | 64333.8 | 575505.8 |
1986 | 9 | 688212 | 640993.1 | 595506.1 | 686480.1 | 68230.5 | 677387.8 |
1987 | 10 | 746422 | 704250.4 | 660752.7 | 747748.2 | 65246.6 | 754710.7 |
1988 | 11 | 809592 | 767455.4 | 724774.3 | 810136.4 | 64021.6 | 812994.8 |
1989 | 12 | 791376 | 781807.8 | 758994.4 | 804621.1 | 34220.1 | 874158.1 |
1990 | 13 | 772682 | 776332.3 | 769397.1 | 783267.5 | 10402.8 | 838841.2 |
1991 | 14 | 806048 | 794161.7 | 784255.9 | 804067.6 | 14858.8 | 793670.2 |
1992 | 15 | 860855 | 834177.7 | 814209.0 | 854146.4 | 29953.1 | 818926.3 |
1993 | 16 | 996630 | 931651.5 | 884674.5 | 978628.5 | 70465.5 | 884099.5 |
1994 | 17 | 1092883 | 1028390.4 | 970904.0 | 1085876.8 | 86229.6 | 1049094.0 |
1995 | 18 | 1172596 | 1114913.8 | 1057309.9 | 1172517.6 | 86405.8 | 1172106.3 |
1996 | 19 | 1245356 | 1193179.1 | 1138831.4 | 1247526.8 | 81521.5 | 1258923.5 |
1997 | 20 | 1326094 | 1272928.0 | 1219289.4 | 1326566.7 | 80458.0 | 1329048.3 |
1998 | 21 | 1378717 | 1336401.4 | 1289556.6 | 1383246.2 | 70267.2 | 1407024.7 |
1999 | 22 | 1394413 | 1371208.4 | 1338547.7 | 1403869.1 | 48991.1 | 1453513.4 |
2000 | 23 | 1478573 | 1435627.1 | 1396795.4 | 1474458.9 | 58247.7 | 1452860.1 |
2001 | 24 | 1534122 | 1494724.1 | 1455552.6 | 1533895.5 | 58757.2 | 1532706.6 |
2002 | 25 | 1608150 | 1562779.6 | 1519888.8 | 1605670.4 | 64336.2 | 1592652.8 |
2003 | 26 | 1670006.7 | |||||
2004 | 27 | 1734342.9 |
(1)第一步,计算一次指数平滑值。取,根据一次指数平滑公式,可计算各期的一次指数平滑预测值:
1978年:
1979年:
同理可得各年的一次指数平滑预测值,见表1中第④栏。
(2)第二步,根据(1)式和第一步计算的 ,计算各期的二次指数平滑值,见表1中第⑤栏。如:
其余各期以此类推。
(3)第三步,计算各期参数变量值α、b。根据(3)式,可计算各期的α、b,分别见表第⑥、第⑦栏。如
(4)第四步,根据(4)式和(2)式分别求各期的趋势预测值,见表中最后一栏。如:
2000年预测值;
进行外推预测,则
2003年预测值;
2004年预测值。
把各年的预测值绘成曲线与原时间序列的散点图比较(见上图),可以看出,二次指数平滑法由于考虑了时间序列在不同时期直线参数的变化,其预测值与原时间序列的拟合程度非常好。上图中也给出了用最小二乘法拟合的趋势直线,相比之下,用二次指数平滑法拟合的趋势线更好地体现了原时间序列在不同时间段的变化趋势。
参考:
https://blog.csdn.net/weixin_40396948/article/details/79108469