机器学习:【2】jupyter显存不足报错Blas GEMM launch failed的解决方案

时间:2024-06-03 08:16:57

前言:

这两天利用jupyter进行训练模型时,总会出现莫名错误,但是重启电脑后错误又会自行消失。往往打开jupyter后,第一次可以正常训练,第二次类似的程序就会报错,经过百度各路大神的博客,终于找到了原因是因为jupyter占用显存过多导致。

问题描述&解决:

机器学习:【2】jupyter显存不足报错Blas GEMM launch failed的解决方案

上图是本人遇到的奇怪错误,显示报错信息为内部错误,无奈太菜看不太明白报错信息。

经过运行nvidia-smi,证明是由于GPU显存不足导致。

机器学习:【2】jupyter显存不足报错Blas GEMM launch failed的解决方案

手动运行命令行命令,终止对应进程就可以释放显存了。

机器学习:【2】jupyter显存不足报错Blas GEMM launch failed的解决方案

不过这个办法还是有些繁琐,后续找到更好的办法再来填坑~