前言
2019年研究生数学建模已经过去了,但最终成绩是三等奖,离理想目标还是有不少差距。今天是19年12月,特此总结比赛得失,并与一等奖作品进行对比,寻找差距。
本人选择的是D题,内容如下:
汽车行驶工况(Driving Cycle)又称车辆测试循环,是描述汽车行驶的速 度时间曲线(如图 1、2,一般总时间在 1800 秒以内,但没有限制标准,图 1 总 时间为 1180 秒,图 2 总时间为 1800 秒),体现汽车道路行驶的运动学特征,是汽车行业的一项重要的、共性基础技术,是车辆能耗/排放测试方法和限值标准 的基础,也是汽车各项性能指标标定优化时的主要基准。
在上述背景下,根据某城市轻型汽车实际道路行驶采集的数据(采样频率 1Hz),来构建出一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线(1200-1300秒),该曲线所体现的汽车运动特征(如平均速度、平均加速度等)。
由汽车行驶数据的采集设备直接记录的原始采集数据往往会包含一些不良数据值,不良数据主要包括几个类型:
(1)由于高层建筑覆盖或过隧道等,GPS 信号丢失,造成所提供数据中的时 间不连续;
(2) 汽车加、减速度异常的数据(普通轿车一般情况下:0 至100km/h 的加 速时间大于7 秒,紧急刹车最大减速度在 7.5∼8m/s2);
(3)长期停车(如停车不熄火等候人、停车熄火了但采集设备仍在运行等)所采集的异常数据;
(4) 长时间堵车、断断续续低速行驶情况(最高车速小于10km/h), 通常可按怠速情况处理;
(5) 一般认为怠速时间超过 180 秒为异常情况,怠速最长时间可按 180 秒处理;
请设计合理的方法将上述不良数据进行预处理,并给出各文件数据经处理后的记录数。同时提取有效的运动学片段,并构建汽车行驶工况。
本文主要解决以下三个问题:
1、 对附件中不良数据的主要类型进行处理,并给出处理后的记录数;
2、 对处理后的数据进行运动学片段的提取;
3、 通过科学、有效的构建方法(数学模型或算法),构建一条能体现参与数据采集汽车行驶特征的汽车行驶工况曲线(1200-1300 秒),同时该曲线需满足以下要求:
(1)具备合理的汽车运动特征评估体系;
(2)按照所构建的汽车行驶工况及汽车运动特征评估体系,分别计算出汽车行驶工况与该城市所采集数据源的各运动特征的值,并说明所构建的汽车行驶工况的合理性.
数据预处理
主要思路:路径地图观察-提出清洗办法-得到最终结果
首先,我们通过经纬度数据,绘制某天汽车行驶路径的行驶情况,来观察地形以及交通情况:
此地图通过调用python的folium库绘制,这是整体正常的路径。同时我们还额外绘制了若干条异常行驶的路径,发现汽车丢失的数据,多在山区和隧道。然而,一等奖大佬的路径图如下:
他在汽车路径的基础上,引入速度属性,能更直观地掌握汽车行驶的实时信息。相比之下,我们浪费较多时间。必须承认,这就是实力和思维的差距。
其次,针对初步掌握交通行驶情况,我们针对数据中存在的异常值、缺失值等问题,提出解决办法:
-
对于山区和过隧道导致的数据丢失情况,采取拉格朗日插值的方法进行处理:
-
对于加减速异常的情况,先计算当前时刻的加速度,把高于题目中所给上限的都改成上限值3.78,下限-8同理。
-
长期停车所采集的数据,表示发动机转速为0,但设备依旧在采集,本文采用删除的方法进行处理.
-
长时间堵车的数据,是指在一段时间内最高车速都小于 10的数据。在 180 秒内最高速度都小于10,则该段数据按照怠速处理(车速修正为 0).
-
怠速异常的数据,是指怠速时长超过 180 秒的时间段,通过剔除多余时常的方法进行处理,由于处理第 3,4 类数据后会产生怠速数据,故处理怠速异常数据放在最后进行.。
最终,预处理后的文件数:
运动片段提取
针对预处理完毕的数据,我们进行运动片段提取。判断标准:超过180S,小于15S。
整体思路是:识别怠速状态-分割删除片段-提取有效片段。
某段有效片段如下:
一等奖大佬的图如下:
模型构建
整体思路:建立特征评价体系-运动学片段聚类-评估算法模型性能
本项目首先使用PCA降维算法,针对主要特征主成分进行初步分析。同时,通过统计分析,进一步了解各运动参数、运动学特征的分布情况,最终建立特征评价体系。
截取论文中部分图片:
通过对K的取值,对运动学片段特征的分类效果进行评估,由图可知将运动学片段分为 2 类的效果较好。
感想
本次建模收获良多获得三等奖成绩,在短短时间内完成较为复杂的任务挺不容易的。非常感谢实验室的老师以及师兄师姐的帮助,非常感谢认真严谨、可爱又迷人的队友们。不多说,睡觉去了,睡醒峡谷见。