要作数值预测,最好的方法莫过于回归预测。通过建立起影响因素(即自变量)与目标变量之间的函数关系式,就可以对因变量的未来值进行预测。
尽管回归分析在预测时比较准确,但是,实现比较复杂,因为它要求能够找到所有或大部分影响事物的关键因素,这样才能够建立回归模型进行预测。
但是,在真实的场景中,要找出影响事物的关键因素是非常困难的,比如,大多数社会经济指标,如国内生产总值(GDP)、消费价格指数(CPI)、上证综合指数等等,要找出影响因素来建模,基本上不太可能,所以这种场景下,采用回归分析难以实现。
那该怎么办呢?
此时,可以尝试使用另一种分析方法,即时间序列分析法。
基本原理
时间序列分析,不像回归分析,它是抛开了对事物发展的因果分析,只分析事物的过去和未来的联系,即它假定事物的过去趋势会延伸到未来。
时间序列(Time series),指的是按照相等时间间隔的顺序而形成的数据序列。一般情况下,大多数社会经济指标,如GDP、CPI、利率、汇率等等都是时间序列。
时间序列的时间间隔可以是分秒(如股票金融数据),也可以是日、周、月、季度、年,甚至更大的时间单位。
时间序列分析基于这样一个假设:事物过去的模型可以持续到未来。
时序形态
简单地,一个时间序列会随着时间变化而变化,如下图所示的几种变化形式。
比如左上第一个序列,有着明显的季节性波动;右上第二个序列,有整体下降的趋势;左下第三个序列,呈现上升趋势而且具有季节波动;右下第四个序列,没有明显的趋势也没有季节波动。
![](http://images.blogchina.com/artpic_upload_v5/5ae14104a5cb0.png!m1024)
常用方法
最常见的时间序列分析模型和方法有如下三大类:
1) 趋势类分析:移动平均、指数平滑等
2) 季节波动类分析:温特斯方法、基于回归的方法
3) 平稳序列类分析:自回归滑动平均模型
每一大类中,都会有多种分析方法和模型。
![](http://images.blogchina.com/artpic_upload_v5/5ae14115adc78.png!m1024)
傅一航,大数据专家。
主讲《大数据变革与商业模式创新》《大数据与商业智能》《大数据精准营销》《大数据分析与挖掘》《大数据建模》等课程。
邮箱:2509626286@qq.com