文件名称:Shake-Shake regularization.pdf
文件大小:1.3MB
文件格式:PDF
更新时间:2023-02-22 15:02:32
深度学习 Shake-Shake
本文介绍的Shake-Shake方法旨在帮助深度学习从业者面临过度拟合问题。 这个想法是在多分支机构中取代网络,具有随机仿射的并行分支的标准求和组合。 适用于3分支残差网络,摇动正则化改善了CIFAR-10和CIFAR-测试错误率分别为2.86%和15.85%,为100。在没有跳过连接或批处理规范化的体系结构上进行的实验表明,令人鼓舞的结果为大量应用打开了大门。