参加河北省研究生数学建模比赛有感

时间:2024-05-22 20:56:59

许久未写blog,半月前调通了一种自己改进的GAPSO算法(遗传算法和粒子群算法结合的算法),但是迟迟找不到一种适用的场景,调过频谱分配问题,但是效果不好(PSO都比GAPSO强)。同学喊我参加数学建模比赛,犹豫许久,决定试试,之前也没事会做OJ,但做完几个小题后心里还是空荡荡的。这次参加建模后,一块石头落地了,知道自己学习中的不足。
看到审核未通过的那一刻,整个人宕机了。
原因是查重未通过。(超过40%)
在此就不xx竞赛组了。(真的没想到会查重,缺乏竞赛经验)
一、总结一下经验吧。
1、时间分配
这次时间分配还是可以的,就是写论文的时间太晚了。
参加河北省研究生数学建模比赛有感
2、工作分配
我们主要把经历放在编程上。看大佬的经验要分成建模、编程、写作三部分。

3、选题
选题还是挺重要的,尽量选大家都会得,每个人的侧重点肯定不一样,遵循少数服从多数的原则。

二、赛题(2019.C题)
请你们查阅相关资料和数据,结合数据特点,建立数学模型研究下列问题:
1、问题1:运动目标的检测
(1) 完成附件1的图像序列中运动目标的检测,用矩形框定位出4个运动目标,其中骑车人和其余3人分别用2种不同颜色的矩形框定位。
(2) 完成附件2的红外视频中运动目标的检测,用矩形框定位出7个运动目标,其中车和人分别用2种不同颜色的矩形框定位,并把定位结果用视频展示。
2、问题2:运动目标的语义分割
(1) 完成附件1的图像序列中运动目标的语义分割,分割出4个运动目标,其中骑车人和其余3人分别用2种不同颜色标注。
(2) 完成附件2的红外视频中运动目标的语义分割,分割出7个运动目标,其中车和人分别用2种不同颜色标注,并把分割结果用视频展示。
3、问题3:运动目标的实例分割
(1) 完成附件1的图像序列中运动目标的实例分割(同时检测和分割),分割出4个运动目标,其中4个目标分别用4种不同颜色标注。
(2) 完成附件2的红外视频中运动目标的实例分割(同时检测和分割),分割出7个运动目标,其中7个目标分别用7种不同颜色标注,并把分割结果用视频展示。
4、问题4:性能评价
完成上述所实现的模型(或算法)的性能评价,给出优缺点分析。

三、解题
第一问,我们很顺利调通帧差法和混合高斯法。网上代码很多。(图片为竞赛提供)
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
第二、三问,卡住了,最后决定用神经网络做(查了论文,做语义分割的基本都是神经网络)。
大腿同学选了FCN网络。(具体调程是那个同学做的)训练出来效果不好,无法分类,全是蓝色的,尽管上色应该是个RGB图像。
后来我们自己用labelme打标签,但是比赛只提供了200幅图片,就直接将这些复制了n份(这样做似乎不合理,但是实际训练结果变好很多)。
下面那张图是一开始的效果(不同颜色就是不同类别)
参加河北省研究生数学建模比赛有感
我们考虑此问题主要原因有
(1)网络定义类过多。参考官方文档,对类定义了十多种,但实际任务要求只需要对网络定义三类进行训练,背景类、行人类、汽车人类。
(2)官方数据集所用来训练网络的图片并不完全适合问题场景,我们在训练集中加入了附件图片去训练网络,我们对附件图片使用labelme软件进行标签定义区域类别。
(3)训练次数过少。开始时,仅对网络进行几千次训练,测试误差在2.7%左右,后续我们对网络进行1万到3万次的训练,测试误差在0.3%左右。
经过总结上述问题后,我们对网络、训练集、训练方法进行改进,重新解决语义分割问题。改进采用方法后,VGG16语义分割模型针对问题2(1)产生语义分割效果图如图所示
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
实际上用FCN处理后出来的结果是一张灰度图,我们需要对其上色。
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
参加河北省研究生数学建模比赛有感
问题四、性能分析
参加河北省研究生数学建模比赛有感
针对问题二,基于FCN的语义分割。FCN对图像进行像素级的分类,从而解决了语义级别的图像分割(semantic segmentation)问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。FCN缺点是得到的结果还是不够精细。进行8倍上采样虽然比32倍的效果好了很多,但是上采样的结果还是比较模糊和平滑,对图像中的细节不敏感。是对各个像素进行分类,没有充分考虑像素与像素之间的关系。忽略了在通常的基于像素分类的分割方法中使用的空间规整(spatial regularization)步骤,缺乏空间一致性。
而且神经网络有几大缺点:1.网络层次深,训练时间长,参数多;2.网络不可解释性;3.需要大量带有标签的数据。
针对问题三,基于FCN和混合高斯法的实例分割。我们解决问题三,是在问题二生成的语义分割图的基础上进行了目标检测。该算法原理简单,检测速度快,但是无法识别重叠目标,而且会存在一定概率误判。

参加比赛还是收获很多的,最后感谢队友,感谢指导老师!