Linux 软件看门狗 watchdog使用介绍

时间:2022-06-14 23:09:05

背景:

root@119.10.6.23:/usr/local/php# ps aux|grep watchdog

root 6 0.0 0.0 0 0 ? S Aug28 4:50 [watchdog/0]
root 10 0.0 0.0 0 0 ? S Aug28 4:11 [watchdog/1]
root 14 0.0 0.0 0 0 ? S Aug28 3:58 [watchdog/2]
root 18 0.0 0.0 0 0 ? S Aug28 3:36 [watchdog/3]

附:

最简单的安装教程(CentOS)

yum install watchdog -y
modprobe softdog
chkconfig watchdog on
/etc/init.d/watchdog start

配置看门狗程序,开机自动运行

chkconfig watchdog on

启动看门狗

sudo /etc/init.d/watchdog start

 

Linux 自带了一个 watchdog 的实现,用于监视系统的运行,包括一个内核 watchdog module 和一个用户空间的 watchdog 程序。内核 watchdog 模块通过 /dev/watchdog 这个字符设备与用户空间通信。用户空间程序一旦打开 /dev/watchdog 设备(俗称“开门放狗”),就会导致在内核中启动一个1分钟的定时器(系统默认时间),此后,用户空间程序需要保证在1分钟之内向这个设备写入数据(俗称“定期喂狗”),每次写操作会导致重新设定定时器。如果用户空间程序在1分钟之内没有写操作,定时器到期会导致一次系统 reboot 操作(“狗咬人了”呵呵)。通过这种机制,我们可以保证系统核心进程大部分时间都处于运行状态,即使特定情形下进程崩溃,因无法正常定时“喂狗”,Linux系统在看门狗作用下重新启动(reboot),核心进程又运行起来了。多用于嵌入式系统。

打开 /dev/watchdog 设备(“开门放狗”):

?
1
2
3
4
5
6
int fd_watchdog = open("/dev/watchdog", O_WRONLY);
if(fd_watchdog == -1) {
    int err = errno;
    printf("\n!!! FAILED to open /dev/watchdog, errno: %d, %s\n", err, strerror(err));
    syslog(LOG_WARNING, "FAILED to open /dev/watchdog, errno: %d, %s", err, strerror(err));
}

每隔一段时间向 /dev/watchdog 设备写入数据(“定期喂狗”):

?
1
2
3
4
5
6
7
8
9
//feed the watchdog
if(fd_watchdog >= 0) {
    static unsigned char food = 0;
    ssize_t eaten = write(fd_watchdog, &food, 1);
    if(eaten != 1) {
        puts("\n!!! FAILED feeding watchdog");
        syslog(LOG_WARNING, "FAILED feeding watchdog");
    }
}

关闭 /dev/watchdog 设备,通常不需要这个步骤:

close(fd_watchdog);

所需头文件:

?
1
2
3
4
#include <unistd.h>
#include <sys/stat.h>
#include <syslog.h>
#include <errno.h>

关于Linux 软件看门狗 watchdog的使用就介绍到这,有什么问题可以留言