参考链接:https://blog.csdn.net/linchuhai/article/details/87920764

模型介绍

ARIMA,差分自回归滑动平均模型,又称求自回归滑动平均模型,是时间序列预测分析方法之一。

ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA是“滑动平均”,q为滑动平均项数;d是使之成为平稳序列所做的差分次数(阶数)。

1. ARIMA的优缺点

优点: 模型十分简单,只需要内生变量而不需要借助其他外生变量。

缺点:

1.要求时序数据是稳定的(stationary),或者是通过差分化(differencing)后是稳定的。

2.本质上只能捕捉线性关系,而不能捕捉非线性关系。

注意,采用ARIMA模型预测时序数据,必须是稳定的,如果不稳定的数据,是无法捕捉到规律的。比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

2.ARIMA模型运用流程

以《应用系统负载分析与磁盘容量预测》为案例:

- (平稳性检验)根据时间序列的散点图、自相关系数和偏自相关系数、单位根检验(ADF),来判断数据的平稳性;

- (平稳化处理)对非平稳的时间序列数据进行差分处理,得到差分阶数d;

- (白噪声检测)为了验证序列中有用的信息是否已被提取完毕,如果为白噪声序列,说明序列中有用的信息已经被提取完毕,可以采用LB统计量的方法进行白噪声检验;

- (模型识别和定阶)根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖尾的,则序列适合ARIMA模型。可以采用BIC准则对模型进行定阶,确定p,q参数,从而选择最优模型;

- (模型检验)检验已确定的模型其残差序列是否为白噪声,如果不是白噪声,说明残差中还存在有用的信息,需要修改模型或者进一步提取;

-(模型预测)应用已通过检验的模型进行预测;

3.平稳性检验

(1)看图法

这里的“图”指的是时序图,平稳序列的图a是围绕一个常数上下波动;而不平稳的图b,则是有明显的增长或减少的趋势。

å¨è¿éæå¥å¾çæè¿°

(2)自相关系数和偏自相关系数

这里会涉及到两个定义——截尾和拖尾。

微信æªå¾_20181003171718.png

平稳序列的自相关图和偏相关图要么都是拖尾要么都是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

(3)单位根检验(ADF)
若单位根检验p值小于0.05则认为是平稳的。

4.差分处理

差分即取相邻项值差替代当前值,以此来消除一些波动,使数据趋于平稳。


Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐