1. 背景
有时候跑训练模型需要运行很久,中途网络断开导致训练中断
2. 解决办法:
在训练命令前加一个nohup
比如从 python train.py
改成
nohup python train.py
- 原理:nohup(“no hang up” 的缩写)命令用于在用户退出账户或者终端关闭之后,程序仍然能够继续运行。它会将程序的标准输出和标准错误输出重定向到一个文件(默认是 nohup.out),这样程序就不会因为终端的关闭而收到挂断信号(SIGHUP)。
1. 背景
有时候跑训练模型需要运行很久,中途网络断开导致训练中断
2. 解决办法:
在训练命令前加一个nohup
比如从 python train.py
改成
nohup python train.py