采用二值判断如果确认是噪声,用该点上面一个灰度进行替换。
噪声点处理:对原点周围的八个点进行扫描,比较。当该点像素值与周围8个点的值小于N时,此点为噪点 。
处理后的文件大小只有原文件小的三分之一,前后的图片内容肉眼几乎无法察觉。
但是这样处理后图片放入CNN中在其他条件不变的情况下,模型loss无法下降,二分类图片,loss一直在8-9之间。准确率维持在0.5,同时,测试集的训练误差持续下降,但是准确率也在0.5徘徊。大概真是需要误差,让优化方法从局部最优跳出来。
使用的activation function是relu,full connection layer是softmax分类函数,优化方法为RMsprop
难到是需要加入噪音更好,CNN中加入高斯噪音不是让模型更稳健的吗?还有让模型跳出局部最优的好处,方便训练。
原意:降噪的目的是因为这批数据是样本较少,用复印机 扫面出来的图片,想着放入更干净的数据,模型更容易学习到本质特征。
结果事与愿违,后来查看了BatchNormalization的作用。
更:
在第一层的Maxpooling后面加上,model.add(BatchNormalization()),效果非常显著,第一次epoch的loss值只有0.63,acc也迅速上升,不会出现之前的卡在8.354一直不动,哪怕更换 leraning rate和使用Adagrad,都是一样的,如果前面的5个epoch完,还是没有太大的变化,后面几乎不会收敛。
1,leraning rate的设置
#导入模块,以rmsprop为例
from keras.optimizers import rmsprop
rmsprop=rmsprop(lr=0.1)#只是更改了学习率,其他的参数没有更改,默认学习率是0.001
2.BatchNormalization()的设置
from keras.layers.normalization import BatchNormalization
#网上不少人说,批规范化 加在输入层的激活函数(层)的前面
model.add(BatchNormalization())