循环神经网络案例（2）——利用MATLAB搭建循环神经网络进行厄尔尼诺指数预测

时间序列是按时间顺序组织的数字序列，是数据分析中重要的处理对象之一。时间序列的主要特点是数据获取方式一般具有客观性，能反映某种现象的变化趋势或统计指标，进而预测未来走向，这在本质上也是一个回归预测的问题。长短期记忆网络（LSTM）是一种常用的循环神经网络，适合处理有更长时间跨度的内部记忆，被广泛应用于时间序列分析，能够保持数据的内在持续性，反映数据的细粒度走势，具有良好的预测效果。

wendy_ya

7830人浏览 · 2021-08-05 17:12:54

wendy_ya · 2021-08-05 17:12:54 发布

一、数据集介绍

厄尔尼诺-南方涛动(ENSO)是影响全球极端气候的重要因子，因此预估ENSO海温在全球变暖下的变化也是预估未来全球变暖下全球极端气候变化的重要因素之一。遗憾的是，最近20年来多次的全球耦合模式比较计划(CMIP)尽管对气候平均态和ENSO本身的模拟都取得了长足的进步，但是对未来增暖情形下ENSO海温异常强度的变化都存在显著的模式间差异。最近CMIP5预估的ENSO海温增强或减弱的模式个数基本相当，模式间的标准差远大于多模式集合平均的结果。因此揭示各模式预估ENSO海温振幅变化存在显著差异的核心物理过程是未来进一步改进模式、提高模式预估可信度的必要途径。
MATLAB自带了enso的数据集，只需要load就可加载：

load enso

加载后，工作区增加了month和pressure两个168*1的数据。我们可以利用plot函数绘制enso的时间序列数据，绘制代码如下：

load enso
figure;plot(month,pressure,'k:',month,pressure,'r*');

运行图像：
在这里插入图片描述

二、通过样条算法进行曲线拟合

通过MATLAB提供的fit函数可以方便进行曲线拟合及预测分析，主要代码如下：

close all;clear all;clc;
rand('seed',10)  %设置随机数种子
%加载数据
load enso
data_x=month;data_y=pressure;
%样条拟合
[res1,res2,res3]=fit(data_x,data_y,'smoothingspline');
%绘图
figure;
subplot(2,1,1)
plot(data_x,data_y,'r*');
hold on;
plot(res1,data_x,data_y);
title(sprintf('样条分析-RMSE=%.2f',res2.rmse));
subplot(2,1,2)
stem(data_x,res3.residuals)
xlabel('Time');ylabel('Error');
title('样条分析-误差图');

采用样条算法进行拟合并绘制误差曲线，其效果如下：
在这里插入图片描述
可以发现，直接采用样条算法可以得到平滑的拟合曲线，能在一定程度上反映数据的分布状况，但也存在较多的误差，其RMSE值为1.52，相对较大。

三、基于MATLAB的LSTM预测

3.1 定义LSTM网络函数

函数代码如下：

function layers=get_lstm_net(wd)
%网络架构
numFeatures=wd;
numResponses=1;
numHiddenUnits=250;

layers=[sequenceInputLayer(numFeatures)
    lstmLayer(numHiddenUnits)
    dropoutLayer(0.1)
    lstmLayer(2*numHiddenUnits)
    dropoutLayer(0.1)
    fullyConnectedLayer(numResponses)
    regressionLayer];

end

定义完后，在命令行窗口可以调用该网络函数，并使用网络设计器进行可视化分析，核心代码如下：

 layers=get_lstm_net(5);
deepNetworkDesigner

效果如图所示：
在这里插入图片描述
可以发现，设计的网络共有7层，且最后一层为回归层。

3.2 主函数

主函数代码如下：

close all;clear all;clc;
rand('seed',10);  %设置随机数种子
%% I.加载数据
load enso
data_x=month';
data_y=pressure';
%% II.数据预处理
mu=mean(data_y);%计算均值
sig=std(data_y);%计算标准差
data_y=(data_y-mu)/sig;%数据归一化
%% III.数据准备
wd=5;
len=numel(data_y);%计算data_y中元素数目
wdata=[];
for i=1:1:len-wd
    di=data_y(i:i+wd);
    wdata=[wdata;di];
end
wdata_origin=wdata;
index_list=randperm(size(wdata,1));%整数随机排序
ind=round(0.8*length(index_list));%四舍五入
train_index=index_list(1:ind);
test_index=index_list(ind+1:end);
train_index=sort(train_index);
test_index=sort(test_index);

%% IV.划分训练集、测试集的数据和标签
dataTrain=wdata(train_index,:);
dataTest=wdata(test_index,:);
XTrain=dataTrain(:,1:end-1)';
YTrain=dataTrain(:,end)';
XTest=dataTest(:,1:end-1)';
YTest=dataTest(:,end)';

%% V.网络构建
layers=get_lstm_net(wd);
options=trainingOptions('adam',...
    'MaxEpochs',1000,...
    'GradientThreshold',1,...
    'InitialLearnRate',0.005, ...
    'LearnRateSchedule','piecewise',...
    'LearnRateDropPeriod',125,...
    'LearnRateDropFactor',0.2,...
    'Verbose',0,...
    'Plots','training-progress');

%% VI.训练
net=trainNetwork(XTrain,YTrain,layers,options);
%% VII.测试
Xall=wdata_origin(:,1:end-1)';
Yall=wdata_origin(:,end)';
YPred=predict(net,Xall,'MiniBatchSize',1);
rmse=mean((YPred(:)-Yall(:)).^2);

%% VIII.显示
figure,
subplot(2,1,1)
plot(data_x(1:length(Yall)),Yall)
hold on;
plot(data_x(1:length(Yall)),YPred,'.-')
hold off;
legend(['Real','Predict'])
ylabel('Data')
title(sprintf('LSTM分析-RMSE=%.2f',rmse));
subplot(2,1,2)
stem(data_x(1:length(Yall)),YPred-Yall)
xlabel('Time');ylabel('Error');
title('LSTM分析-误差图');