MatherCup一等奖——基于时间序列、LSTM等预测优化类1314模型集的论文分享
值数据,用
q-q
图
以及
Kolmogorov-Smirnov
检验判定
得知本文数据集服从
正态分布
,本文决定采用
3
σ
原则
判定异常值,认定落于三倍标准差之外的数据点为异常值,将筛查出来的异常值转换为缺失值, 用牛顿插值对缺失值进行线性填充,降低异常数值对预测结果带来的负面影响。基于商家+
仓库
+
商 品维度等多种特征,考虑到所需数据过于庞大,本文决定采用K-means
聚类方式进行特征分类。然后 综合使用ARIMA
、
LSTM
和多元线性回归
三种时间序列预测方法对本文使用数据进行拟合,用
粒子 群优化算法对三种预测方法得到的预测结果进行加权计算,其结果表明加权预测模型的各个预测指标 要优于原先的任一预测模型。本文采用均方根误差(
RMSE
)、平均绝对百分比误差(
MAPE
)、平 均绝对误差(MAE
)、确定系数
(
R
2
)
作为本文建立基于时间的经济预测模型的四大评价指标,以此 对预测模型的预测结果进行量化分析,经过检验,其中加权预测模型的预测准确率为95.92%
。将以上 “1+3+1+4
”种模型作为本文完整的预测流程,用此模型得到问题一所需的需求量预测值。