linux下利用crontab来实现定时任务
crontab是Unix和Linux用于设置周期性被执行的指令,是互联网很常用的技术,很多任务都会设置在crontab循环执行,如果不使用crontab,那么任务就是常驻程序,这对你的程序要求比较高,一个要求你的程序是24X7小时不宕机,一个是要求你的调度程序比较可靠,实际工作中,90%的程序都没有必要花这么多时间和精力去解决上面的两个问题的,只需要写好自己的业务逻辑,通过crond这个工业级程序去调度就行了,crond的可靠性,健壮性,大家应该是毫无疑问的。
crontab简单使用
假设我要设置一个任务,每分钟就要做一个数据同步,这个同步脚本的路径是/home /test/rsyncfile.sh,那么我可以在这么配置,使用test用户,在终端输入
crontab-e
# 此时会进入 vi 的编辑画面让您编辑工作!注意到,每项工作都是一行。
#分时日 月周 |<==============任务的完整命令行
* * * * * /home/test/rsyncfile.sh
默认情况下,任何使用者只要不被列入 /etc/cron.deny 当中,那么他就可以直接下达[ crontab -e ]去编辑自己的例行性命令了!整个过程就如同上面提到的,会进入 vi 的编辑画面, 然后以一个工作一行来编辑,编辑完毕之后输入[ :wq ]储存后离开 vi 就可以了!
假如我们需要修改为每5分钟运行数据同步的脚本,那么同样使用 crontab -e 进入编辑:
*/5* * * * /home/test/rsyncfile.sh
假如服务器出了问题,有一天的数据没有同步,于是我们就需要补数据了,假设这个补数据的脚本是/home /test/rsyncfile_day.sh,但是白天是高峰期,晚上用户不多,是低峰期,我们补数据会占用大量带宽,尤其是白天,会影响正常业务,所以一般我们可以让补数据任务在凌晨2点开始跑,那么同样使用crontab -e 进入编辑:
0 21 4 * /home/test/rsyncfile_day.sh
这样,在4月1号凌晨2点0分就会开始启动我们的补数据的脚本了。
同步数据,在互联网公司是再平常不过的任务了,这里大家可以看到crontab的魅力所在了,只需要写最简单的业务逻辑,把调度交给crond做,就完成了一个可靠性很高的一项任务了,如果要自己去额外写这种调度程序,不知道要花多少精力才能做到可靠稳定。
crontab的语法
crontab[-u username] [-l|-e|-r]
选项与参数:
-u :只有 root 才能进行这个任务,亦即帮其他使用者创建/移除 crontab 工作排程;
-e :编辑 crontab 的工作内容
-l :查阅 crontab 的工作内容
-r :移除所有的 crontab 的工作内容,若仅要移除一项,请用 -e 去编辑
查询使用者目前的 crontab 内容:
crontab-l
*/5* * * * /home/test/rsyncfile.sh
0 21 4 * /home/test/rsyncfile_day.sh
清空使用者目前的 crontab:
crontab-r
crontab-l
nocrontab for test
如果你想删除当前用户的某一个crontab任务,那么使用crontab -e进入编辑器,再删除对应的任务。
crontab的限制
/etc/cron.allow:将可以使用 crontab 的帐号写入其中,若不在这个文件内的使用者则不可使用 crontab;
/etc/cron.deny:将不可以使用 crontab 的帐号写入其中,若未记录到这个文件当中的使用者,就可以使用 crontab 。
以优先顺序来说, /etc/cron.allow 比 /etc/cron.deny 要优先, 而判断上面,这两个文件只选择一个来限制而已,因此,建议你只要保留一个即可, 免得影响自己在配置上面的判断!一般来说,系统默认是保留 /etc/cron.deny , 你可以将不想让他运行 crontab 的那个使用者写入 /etc/cron.deny 当中,一个帐号一行!
/etc/crontab配置文件讲解
[ crontab -e ]是针对使用者的 cron 来设计的,如果是[系统的例行性任务]时,就要编辑 /etc/crontab 这个文件。
那就是 crontab -e 这个 crontab 其实是 /usr/bin/crontab 这个运行档,但是 /etc/crontab 可是一个[纯文字档],必须用 root 的身份编辑一下这个文件。
首先我们要来看看crontab的文件内容
cat /etc/crontab
SHELL=/bin/sh
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/
#Fordetails see man 4 crontabs
#Example of job definition:
#.---------------- minute (0 - 59)
#| .------------- hour (0 - 23)
#| | .---------- day of month (1 - 31)
#| | | .------- month (1 - 12) ORjan,feb,mar,apr ...
#| | | | .---- day of week (0 - 6) (Sunday=0 or 7) ORsun,mon,tue,wed,thu,fri,sat
#| | | | |
#* * * * * user-namecommand to be executed
17* * * * root cd / && run-parts --report /etc/cron.hourly
这个文件与将刚刚我们下达 crontab -e 的内容几乎完全一模一样!只是有几个地方不太相同
PATH=....:
这里就是输入运行档的搜寻路径!使用默认的路径配置就已经很足够了!
17 * * * * root cd / && run-parts--report /etc/cron.hourly:
这个 /etc/crontab 里面预配置义出四项工作任务,分别是每小时、每天、每周及每个月分别进行一次的工作! 但是在五个栏位后面接的并不是命令,而是一个新的栏位,那就是[运行后面那串命令的身份]为何!这与使用者的 crontab -e 不相同。由於使用者自己的 crontab 并不需要指定身份,但 /etc/crontab 里面当然要指定身份啦!系统默认的例行性工作是以 root 的身份来进行的。
那么后面那串命令是什么呢?你可以使用[which run-parts ]搜寻看看,其实那是一个 bash script 啦!如果你直接进入/usr/bin/run-parts 去看看, 会发现这支命令会将后面接的[目录]内的所有文件捉出来运行!这也就是说[ 如果你想让系统每小时主动帮你运行某个命令,将该命令写成 script,并将该文件放置到 /etc/cron.hourly/目录下即可]的意思!
现在你知道系统是如何进行他默认的一堆例行性工作排程了吗?如果你下达[ ll /etc/cron.daily ]就可以看到一堆文件, 那些文件就是系统提供的 script ,而这堆 scripts 将会在每天的凌晨 6:25 开始运行!
假设你现在要作一个目录,让系统可以每 2 分钟去运行这个目录下的所有可以运行的文件,你可以写下如下的这一行在 /etc/crontab 中:
*/2* * * * root run-parts /etc/cron.min
当然, /etc/cron.min 这个目录是需要存在的喔!那如果我需要运行的是一个[程序]而已, 不需要用到一个目录呢?该如何是好?例如在侦测网络流量时,我们希望每五分钟侦测分析一次, 可以这样写:
*/5* * * * root /bin/mrtg /etc/mrtg/mrtg.cfg
如何!创建例行性命令很简单吧!如果你是系统管理员而且你的工作又是系统维护方面的例行任务时, 直接修改 /etc/crontab 这个文件即可喔!又便利,又方便管理呢!
crontab的原理
当使用者使用 crontab 这个命令来创建工作排程之后,该项工作就会被纪录到 /var/spool/cron/ 里面去了,而且是以帐号来作为判别的喔!举例来说, blue 使用 crontab 后, 他的工作会被纪录到 /var/spool/cron/blue 里头去!但请注意,不要使用 vi 直接编辑该文件, 因为可能由於输入语法错误,会导致无法运行 cron 喔!另外, cron 运行的每一项工作都会被纪录到 /var/log/cron 这个登录档中,所以,如果你的 Linux 不知道有否被植入木马时,也可以搜寻一下 /var/log/cron 这个登录档呢!
crond服务的最低侦测限制是[分钟],所以[ cron 会每分钟去读取一次 /etc/crontab 与 /var/spool/cron 里面的数据内容 ],因此,只要你编辑完 /etc/crontab 这个文件,并且将他储存之后,那么 cron 的配置就自动的会来运行了!
备注:在 Linux 底下的 crontab 会自动的帮我们每分钟重新读取一次 /etc/crontab 的例行工作事项,但是某些原因或者是其他的 Unix 系统中,由於 crontab 是读到内存当中的,所以在你修改完 /etc/crontab 之后,可能并不会马上运行, 这个时候请重新启动 crond 这个服务吧![/etc/init.d/crond restart]
crontab的格式讲解
每项工作 (每行) 的格式都是具有六个栏位,这六个栏位的意义为:
代表意义 |
分钟 |
小时 |
日期 |
月份 |
周 |
命令 |
数字范围 |
0-59 |
0-23 |
1-31 |
1-12 |
0-7 |
命令 |
比较有趣的是那个[周]喔!周的数字为 0 或 7 时,都代表[星期天]的意思!另外, 还有一些辅助的字符,大概有底下这些:
特殊字符 |
代表意义 |
*(星号) |
代表任何时刻都接受的意思!举例来说,范例一内那个日、月、周都是 * , 就代表著[不论何月、何日的礼拜几的 12:00 都运行后续命令]的意思! |
,(逗号) |
代表分隔时段的意思。举例来说,如果要下达的工作是 3:00 与 6:00 时,就会是: 0 3,6 * * * command 时间参数还是有五栏,不过第二栏是 3,6 ,代表 3 与 6 都适用! |
-(减号) |
代表一段时间范围内,举例来说, 8 点到 12 点之间的每小时的 20 分都进行一项工作: 20 8-12 * * * command 仔细看到第二栏变成 8-12 喔!代表 8,9,10,11,12 都适用的意思! |
/n(斜线) |
那个 n 代表数字,亦即是[每隔 n 单位间隔]的意思,例如每五分钟进行一次,则: */5 * * * * command 很简单吧!用 * 与 /5 来搭配,也可以写成 0-59/5 ,相同意思! |
周与日月不可同时并存
另一个需要注意的地方在於:[你可以分别以周或者是日月为单位作为循环,但你不可使用「几月几号且为星期几」的模式工作]。 这个意思是说,你不可以这样编写一个工作排程:
3012 11 9 5 root echo "justtest" <==这是错误的写法
本来你以为九月十一号且为星期五才会进行这项工作,无奈的是,系统可能会判定每个星期五作一次,或每年的 9 月 11 号分别进行,如此一来与你当初的规划就不一样了~所以,得要注意这个地方!上述的写法是不对的!