不同的定性预测模型方法或定量预测模型方法各有其优点和缺点,它们之间并不是相互排斥的,而是相互联系、相互补充的。由于每种预测方法利用的数据信息不尽相同,不同的预测方法从不同的角度挖掘各方面有用的信息。在预测的过程中,如果想当然的认为某个单项预测方法的预测误差较大,随之把该种预测方法弃之不用,就可能造成部分有用的信息丢失,使预测精度受到影响。

组合模型即是将多个模型的结果进行组合,从而充分利用各个模型的信息。有效提高预测精度。

设有 k k k 种方法,第 i i i 种方法在第 t t t 期的预测值记为 y ^ i t \hat{y}_{it} y^it,则第 t t t 期的组合预测值有以下几种计算方法

(1)
Y ^ t = ∑ i = 1 k y ^ i t w i , i = 1 , 2 , ⋯   , k \hat{Y}_t=\sum_{i=1}^k{\hat{y}_{it}w_i}\text{,}i=1,2,\cdots ,k Y^t=i=1ky^itwii=1,2,,k

(2)
Y ^ t = ∑ i = 1 k y ^ i t w i , i = 1 , 2 , ⋯   , k \hat{Y}_t=\sum_{i=1}^k{\hat{y}_{it}^{w_i}}\text{,}i=1,2,\cdots ,k Y^t=i=1ky^itwii=1,2,,k
(3)

Y ^ t = 1 ∑ i = 1 k w i y ^ i t , i = 1 , 2 , ⋯   , k \hat{Y}_t=\frac{1}{\sum_{i=1}^k{\frac{w_i}{\hat{y}_{it}}}}\text{,}i=1,2,\cdots ,k Y^t=i=1ky^itwi1i=1,2,,k

对于其中 w i w_i wi 的确定方法

常见的权重选择方法有等权重法、标准差法、方差倒数法、均方倒数法、AHP法、德尔菲法、最优加权法等。


(1)等权重法:即对每一种预测方法赋以相同的权重,这种方法操作简单,但可靠性是最低的,即缺点在于它是对全部模型平均对待,不分主次,预测效果不理想;

(2)优势矩阵法

假设有两个模型,记录这两个模型相对于真实值预测效果更好的次数。记【模型一】预测效果更好的的次数为 n 1 n_1 n1,【模型二】预测效果更好的次数为 n 2 n_2 n2,那么两个模型分别对应的权重为

w 1 = n 1 n 1 + n 2 ; w 2 = n 2 n 1 + n 2 w_1=\frac{n_1}{n_1+n_2}\text{;}w_2=\frac{n_2}{n_1+n_2} w1=n1+n2n1w2=n1+n2n2

(3)方差倒数法:方差倒数法也称为预测误差平方和倒数法,它是通过误差平方和的大小确定权重,即对误差平方和小的模型赋以高权重。

一般来说每种单项预测模型的预测精度不同,预测误差平方和是反映预测精度的一个指标。预测误差平方和越大,表明该项预测模型的预测精度越低,从而它在组合预测中的重要性就降低。重要性的降低表现为它在组合预测模型的组合预测中应赋予较大的加权系数。

公式如下:

w i = Q i − 1 ∑ i = 1 m Q i − 1 w_i=\frac{Q_{i}^{-1}}{\sum_{i=1}^m{Q_{i}^{-1}}} wi=i=1mQi1Qi1

其中, Q i Q_i Qi 即真实值与预测值之间差值的平方和: Q i = ∑ t = 1 n ( y t − y ^ t ( i ) ) 2 Q_i=\sum_{t=1}^n{\left( y_t-\hat{y}_t\left( i \right) \right) ^2} Qi=t=1n(yty^t(i))2,这种方法要求对各模型有一定的了解。

(4)残差倒数法:该方法体现了某单项预测模型的误差平方和越大,它在组合预测中的加权系数就应越小。

w i = S i − 1 ∑ i = 1 k S i − 1 w_i=\frac{S_{i}^{-1}}{\sum_{i=1}^k{S_{i}^{-1}}} wi=i=1kSi1Si1

其中, S i S_i Si 是上一种方法中 Q i Q_i Qi 的平方根,当数据的差均为正值时两种方法的使用没有区别,当数据差有正负之分时,两种方法才有不同。

(5)简单加权法

简单加权平均方法也是一种非等权平均方法。它是先把各单项预测模型预测误差的方差和进行排序,根据各单项预测模型预测误差的方差和与权系数成反比的基本原理知,排序越靠前面的单项预测模型,在组合预测中的加权系数就应越小。

即令

w i = i ∑ i = 1 k i = 2 i k ( k + 1 ) , i = 1 , 2 , ⋯   , k w_i=\frac{i}{\sum_{i=1}^k{i}}=\frac{2i}{k\left( k+1 \right)}\text{,}i=1,2,\cdots ,k wi=i=1kii=k(k+1)2ii=1,2,,k
式中 k k k 个模型按误差平方和 Q i Q_i Qi 降序排列,其基本思想也是对误差平方和小的模型赋以高权重。

(6)标准差法

w i = 1 k − 1 ( 1 − S i ∑ i = 1 k S i ) , i = 1 , 2 , ⋯   , k w_i=\frac{1}{k-1}\left( 1-\frac{S_i}{\sum_{i=1}^k{S_i}} \right) \text{,}i=1,2,\cdots ,k wi=k11(1i=1kSiSi)i=1,2,,k
式中 S i S_i Si 为第 i i i 个模型的标准差, S i = 1 n − 1 ∑ i = 1 k ( y t − y ^ t ( i ) ) 2 S_i=\sqrt{\frac{1}{n-1}\sum_{i=1}^k{\left( y_t-\hat{y}_t\left( i \right) \right) ^2}} Si=n11i=1k(yty^t(i))2

(7)根据有效度确定权重系数

A t = 1 − ∣ y t − y ^ t y t ∣ = 1 − ∣ y t − ∑ i = 1 k y ^ i t w i y t ∣ A_t=1-\left| \frac{y_t-\hat{y}_t}{y_t} \right|=1-\left| \frac{y_t-\sum_{i=1}^k{\hat{y}_{it}w_i}}{y_t} \right| At=1ytyty^t=1ytyti=1ky^itwi
A t A_t At 构成组合预测的精度序列,该序列的均值 E E E 与均方差 σ \sigma σ 分别为

E = 1 n ∑ t = 1 n A t , σ = 1 n ( ∑ t = 1 n ( A t − E ) 2 ) 1 2 E=\frac{1}{n}\sum_{t=1}^n{A_t\text{,}}\sigma =\frac{1}{n}\left( \sum_{t=1}^n{\left( A_t-E \right) ^2} \right) ^{\frac{1}{2}} E=n1t=1nAtσ=n1(t=1n(AtE)2)21

定义组合预测方法的有效度为

S = E ( 1 − σ ) S=E\left( 1-\sigma \right) S=E(1σ)
S越大,说明预测模型的精度越高,预测误差越稳定,模型越有效。

则权重系数为:

w i = S i ∑ j = 1 k S j , i = 1 , 2 , ⋯   , k w_i=\frac{S_i}{\sum_{j=1}^k{S_j}}\text{,}i=1,2,\cdots ,k wi=j=1kSjSii=1,2,,k

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐