cron下执行ntpdate出现的问题

时间:2022-09-30 08:04:14

ntpdate代码:

https://github.com/ntp-project/ntp/tree/stable/ntpdate

编译:

1)./bootstrap

2)autoconf   automake  configure  make,预先安装libtool

 

cron下执行ntpdate出现的问题

问题现象:

在v3.2版本超融合中,osd、mon、controller、compute分别在cron下执行了类型下面的cron语句:

*/3 * * * * root /usr/sbin/ntpdate 10.42.112.157;/sbin/hwclock -w;

但是偶现ntpdate  no server suitable for synchronization found 的错误。

 

正常应该如下:

cron下执行ntpdate出现的问题

 

问题原因:

osd、mon、controller、compute均是主机网络,而ntpd在hcs-server,hcs-server是rancher网络。

osd、mon、controller、compute访问10.42.x.x时,走docker0 路由,即:

cron下执行ntpdate出现的问题

访问ntpd时,发送的报文为:

cron下执行ntpdate出现的问题

可以看见,src为docker0的10.42.0.1 ip,目的ip和端口正确。但有个问题是,若osd、mon这些同时执行呢?

这时候会出现内核区分不了到底报文该分发给哪个上层应用程序,导致明明回复给mon的ntp应答,被osd的socket收走。

cron下执行ntpdate出现的问题

 

ntpdate发送的代码如下:

1)创建一个socket,并绑定至本地的123端口(在不用-u参数的情况)

cron下执行ntpdate出现的问题

cron下执行ntpdate出现的问题

addr就是从ntp的rfc中拿到的123端口,ntpdate程序把该socket绑定到了本端的123,而远端ntp也是123,就是出现了上处srcport = dstport =123 的情形

而-u的情形,本地socket不绑定本端123,这时候发送端的srcport由内核随机分配。

2)发送ntp请求。

 

so,出现上述多个cron同时执行时,最好加上-u参数,区别不同的ntpdate应用程序在同一时刻进行同步的情形。