一、前景介绍
利用lstm做时间序列预测时,首先要将时间序列预处理一下,确定根据前timestep步预测后面的数据。
假定给一个数据集
{
A,B,C,D->E
B,C,D,E->F
C,D,E,F->G
D,E,F,G->H
}
这时timestep为4,即根据前四个的数据预测后一个数据的值。
按此将数据集切分为训练集和测试集。
时间序列预处理函数,生成train_x与train_y:
def create_dataset(dataset, look_back):
#这里的look_back与timestep相同
dataX, dataY = [], []
for i in range(len(dataset)-look_back-1):
a = dataset[i:(i+look_back)]
dataX.append(a)
dataY.append(dataset[i + look_back])
return numpy.array(dataX),numpy.array(dataY)
二、问题出现原因
由于数据集大小所限,当timestep过大,而训练集长度较小时,训练出来的模型进行预测会出现结果波动不大,呈一条直线的情况。
三、解决方法
减小timestep步长。