先上对比图:
原本训练效果:
经过fp16混合精度训练效果:
结果:
1.GPU Menmory 4201MB/5853MB=0.71775
GPU-Util 0.66/0.74=0.89189
2.训练总时间: 1day 15:34/2day 4:00=2374/3120=0.76089
3.time 0.164/0.218=0.75229
4.memory 2719/3790=0.71741
总体来说,用fp16后,资源占有降低25-30%,效果很好
先上对比图:
原本训练效果:
经过fp16混合精度训练效果: