【转】时间序列分析——基于R,王燕

时间:2022-06-16 13:38:48

《时间序列分析——基于R》王燕,读书笔记

笔记:

一、检验:
1、平稳性检验:
  • 图检验方法:
    时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
    自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0(指数级衰减),反之非平稳序列衰减速度会比较慢
  • 构造检验统计量进行假设检验:单位根检验adfTest()——fUnitRoots包
2、纯随机性检验、白噪声检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)
1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
二、模型
1、ARMA平稳序列模型
1.1平稳性检验
1.2ARMA的p、q定阶——acf(),pacf(),auto.arima()自动定阶
1.3建模arima()
1.4模型显著性检验:残差的白噪声检验Box.test();参数显著性检验t分布
2、非平稳确定性分析
2.1趋势拟合:直线、曲线(一般是多项式,还有其它函数)
2.2平滑法
  • 移动平均法:SMA()——TTR包
  • 指数平滑法:HoltWinters()
3、非平稳随机性分析
3.1ARIMA
1平稳性检验,差分运算
2拟合ARMA
3白噪声检验
3.2疏系数模型arima(p,d,f)
3.3季节模型
可以叠加的模型
4、残差自回归模型:
4.1建立线性模型
4.2对滞后的因变量间拟合线性模型,对模型做残差自相关DW检验。dwtest()——lmtest包,增加选项order.by指定延迟因变量
4.3对残差建立ARIMA模型
5、条件异方差模型:异方差检验:LM检验ArchTest()——FinTS包,用ARCH、GARCH模型建模

第一章 简介

  • 统计时序分析方法:
1、频域分析方法
2、时域分析方法
  • 步骤:
1、观察序列特征
2、根据序列特征选择模型
3、确定模型的口径
4、检验模型,优化模型
5、推断序列其它统计性质或预测序列将来的发展
  • 时域分析研究的发展方向:
1、AR,MA,ARMA,ARIMA(Box-Jenkins模型)
2、异方差场合:ARCH,GARCH等(计量经济学)
3、多变量场合:“变量是平稳”不再是必需条件,协整理论
3、非线性场合:门限自回归模型,马尔科夫转移模型

第二章 时间序列的预处理

预处理内容:对它的平稳性和纯随机性进行检验,最好是平稳非白噪声的序列
1、特征统计量
1.1概率分布分布函数或密度函数能够完整地描述一个随机变量的统计特征,同样一个随机变量族{Xt}的统计特性也完全由它们的联合分布函数或联合密度函数决定。
1.2特征统计量:
  • 均值Ex
  • 方差σ2
  • 自协方差函数(γ)和自相关系数(ρ):比较的是1个事件不同时期之间的相互影响程度
2、平稳的时间序列
2.1定义
  • 严平稳:随机变量族的统计性质完全有它们的联合概率分布族决定,若任意的t下的联合概率分布族相等,则认为该序列是严平稳的
  • 宽平稳:统计性质主要由它的低阶矩决定:
1)Ex2<无穷
2)均值为常数:Ex=μ(μ为常数)
3)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
满足以上3点则称为宽平稳时间序列(弱平稳或者二阶平稳)
例子:正态分布
一般满足宽平稳就称作平稳序列,当宽平稳序列服从多元正态分布时,二阶平稳可以推出严平稳。
2.2性质
1)均值为常数:Ex=μ(μ为常数)
2)自协方差和自相关系数只依赖于时间的平移长度而与时间的起止点无关
自相关系数满足相关性系数的3性质:规范性、对称性和非负定性
一个平稳时间序列一定唯一决定它的自相关函数,一个自相关函数未必唯一对应一个平稳时间序列
3、时序图与自相关图
1)时序图:横轴为时间,纵轴为序列取值
2)自相关图:横轴为延期时期数,纵轴为自相关系数
4、平稳性检验
图检验方法
  • 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列
  • 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会很快地衰减向0,反之非平稳序列衰减速度会比较慢
构造检验统计量进行假设检验:单位根检验P205
5、纯随机序列——白噪声
5.1定义
1)Ex=μ(μ为常数)
2)自相关系数γ为0(t!=s),或为σ2(t=s)
在平稳序列中,如果序列值之间没有任何相关性,即一个没有记忆的序列满足以上2个条件,这种序列称为纯随机序列,也称为白噪声序列。记为X~WN(μ,σ2),这是一种最简单的平稳序列。:比如:标准正态分布
5.2性质
1)纯随机序列各项之间没有任何关联,γ=0,随机事件呈现出纯随机波动的特征,就认为该随机事件没有包含任何值得提取的有用信息。
2)方差齐性:序列中每个方差都相等为σ2
5.3纯随机性检验(Box.test(data,type,lag=n)——lag表示输出滞后n阶的白噪声检验统计量,默认为滞后1阶的检验统计量结果)
1、Q统计量:type=“Box-Pierce”
2、LB统计量:type=“Ljung-Box”
  • 平稳序列通常具有短期相关性,若序列之间存在显著的相关关系,通常只存在于延迟时期比较短的序列值之间,因此lag不用全部进行延迟检验。

第三章 平稳时间序列分析——ARMA

1、差分运算
1)p阶差分:p-1阶差分后序列再进行一次1阶差分运算成为p阶差分运算
2)k步差分:相距k期的两个序列值之间的减法运算称为k步差分运算
2、延迟算子:将当前序列值乘以一个延迟算子,即把当前序列值的时间向过去拨一个时刻,记B为延迟算子,则有:
xt-1=B*xt
xt-2=B2*xt
...
xt-p=Bp*xt
用延迟算子表示差分运算:
1)p阶差分:(1-B)pxt
2)k步差分:(1-Bk)xt
3、线性差分方程:zt+a1zt-1+a2zt-2+...+apzt-p=h(t)(p>=1)
  • 齐次线性差分方程:h(t)=0
  • 非齐次线性差分方程:
4、ARMA模型——自回归移动平均模型
1、AR模型
2、MA模型
3、ARMA模型:适用于平稳白噪声序列
平稳序列建模步骤:P72
1)求出该观察值序列的样本相关系数(ACF)和样本偏相关系数(PACF)
2)选择ARMA(p,q)的参数p和q,进行拟合:自动定阶参数auto.arima()——需要zoo包和forecast包P79
3)检验模型的有效性:模型显著性检验(残差序列应该为白噪声序列)和参数显著性检验
4)多建立几个拟合模型,选择最优模型
5)预测forecast()——需要forecast包P100
第四章 非平稳序列——确定性时序分析
4.1非平稳时序的分解:
1)Wold分解定理:对于任何一个离散平稳过程{xt},它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的。
2)Cramer分解定理:任何一个时间序列{xt}都可以分解为两部分的叠加,其中一部分是由多项式决定的确定性趋势成分,另一个是平稳的0均值误差成分
4.2确定性因素分解
  • 四大类因素:
1)长期趋势
2)循环波动
3)季节性变化
4)随机波动
  • 相互作用模式
1)加法模型
2)乘法模型
  • 目标
1)克服其它因素影响,单纯测度某一个确定性因素的(长期趋势或季节效应)
2)推断出各种确定性因素彼此之间的相互作用关系以及它们对序列的综合影响
  • 局限

1)确定性因素分解方法只能提取强劲的确定性信息,对随机性信息浪费严重

2)确定性因素分解方法把所有序列的变化都归结为四因素的综合影响,却始终无法提供明确、有效的方法判断各大因素之间确切的作用关系
4.3趋势分析
  • 趋势拟合法
线性拟合:lm()
曲线拟合:lm或nls,二次型,指数型。。。
  • 平滑法
移动平均法:SMA()——TTR包
指数平滑法:HoltWinters()
4.4季节效应分析:构造季节指数S=季节平均数/总平均数
4.5综合分析decompose()

第五章 非平稳序列——随机时序分析

5.1差分运算:确定信息提取:diff(x,lag,differences)——lag为差分的步长,默认1;differences为差分次数,默认为1
  • 线性趋势,1阶差分就可以实现趋势平稳
  • 曲线趋势,低阶(2阶或3阶)差分就可以提取曲线趋势的影响
  • 周期序列,步长为周期长度的差分运算
  • 综合:趋势+周期的序列——1阶差分去掉线性趋势,在1阶差分的基础上进行12步差分去掉年为单位的周期影响(季节波动)
过差分现象:过多次数的差分导致有效信息的无谓浪费而降低了估计的精度。检测方法是在计算方差,若高阶差分序列的方差大于低阶,则可能是过差分现象
5.2 ARIMA模型——差分运算与ARMA模型的组合
例子:随机游走模型(有效市场理论核心):从起始点找醉汉
性质:平稳性方差齐性
  • ARIMA模型
  • 梳系数模型:模型中有部分自相关系数或平滑系数为0(将自相关较小的阶数的系数设置为0,其它大于2D的系数为NA)
  • 季节模型(加法,乘积)
差分方法
  • 优点:对确定性信息的提取比较充分
  • 局限:很难对模型进行直观解释
自相关:
5.3残差自回归模型:用确定性因素提取序列中主要的确定性信息,检验残差序列的自相关性,若自相关性显著,可以考虑对残差序列拟合自回归模型P163(模型的残差再建模型!)
残差自相关检验:Durbin-Watson(DW)检验-->dwtest()——lmtest包
Durbin h检验:dwtest()——lmtest包,增加选项order.by指定延迟因变量
异方差:
5.4异方差情况:随机误差序列的方差不再是常数,它会随着时间的变化而变化
5.5方差齐性变换:对于标准差与水平成正比的异方差序列,对数变换可以有效地实现方差齐性。P174
5.6条件异方差模型(波动信息)
集群效应:在消除确定性平稳因素的影响之后,残差序列的波动在大部分时段是平稳的,但会在某些时段波动持续偏大,在某些时段波动持续偏小。
ARCH模型——自回归条件异方差模型:只适用于异方差短期自相关过程
ARCH检验P179
  • 拉格朗日乘子检验(LM检验)ArchTest()——FinTS包
  • PortmanteauQ检验:对残差平方序列进行纯随机性检验Box.test()
GARCH模型:在ARCH模型中增加考虑了异方差函数的p阶自相关性而形成的,可以有效地拟合据有长期记忆性的异方差函数

第六章 多元时间序列分析

6.3单位根检验P211:adfTest()——fUnitRoots包
DF检验
  • type=“nc”:无常数均值,无趋势类型
  • type=“c”:有常数均值,无趋势类型
  • type=“ct”:有常数均值,又有趋势类型
非平稳3大类型:
1、无漂移项自回归(不带漂移项的差分平稳序列,DS序列):均值序列非平稳,方差非齐(随机游走模型)
2、带漂移项自回归(带漂移项的差分平稳序列):有趋势且波动性不断增强的非平稳序列
3、带趋势回归(趋势平稳序列,TS):最好通过线性拟合提取序列相关关系,使残差序列平稳
ADF检验:
6.4协整:两个非平稳序列之间具有稳定的线性关系