文件名称:Dropout的隐性和显性正则化效应.pdf
文件大小:1.31MB
文件格式:PDF
更新时间:2023-03-25 18:01:38
Dropout
Dropout是一种广泛使用的正则化技术,通常需要为许多体系结构获得最先进的技术。这项工作表明,dropout引入了两种截然不同但相互纠缠的正则化效应:由于dropout修改了预期的训练目标而产生的显式效应(在之前的工作中也研究过),以及可能令人惊讶的是,dropout训练更新中的随机性带来的另一种隐式效应。
文件名称:Dropout的隐性和显性正则化效应.pdf
文件大小:1.31MB
文件格式:PDF
更新时间:2023-03-25 18:01:38
Dropout
Dropout是一种广泛使用的正则化技术,通常需要为许多体系结构获得最先进的技术。这项工作表明,dropout引入了两种截然不同但相互纠缠的正则化效应:由于dropout修改了预期的训练目标而产生的显式效应(在之前的工作中也研究过),以及可能令人惊讶的是,dropout训练更新中的随机性带来的另一种隐式效应。