Linux下的搜索查找命令的详解(find)

时间:2021-12-23 09:17:57

4.find

  Linux下find命令在目录结构中搜索文件,并执行指定的操作。Linux下find命令提供了相当多的查找条件,功能很强大。由于find具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时间来了解一下。即使系统中含有网络文件系统( NFS),find命令在该文件系统中同样有效,只你具有相应的权限。 在运行一个非常消耗资源的find命令时,很多人都倾向于把它放在后台执行,因为遍历一个大的文件系统可能会花费很长的时间

4.1.命令格式:

find pathname -options [-print -exec -ok ...]

4.2.命令功能:

用于在文件树种查找文件,并作出相应的处理

4.3.命令参数:

pathname: find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录。 
-print: find命令将匹配的文件输出到标准输出。 
-exec: find命令对匹配的文件执行该参数所给出的shell命令。相应命令的形式为'command' {  } \;,注意{   }和\;之间的空格。 
-ok: 和-exec的作用相同,只不过以一种更为安全的模式来执行该参数所给出的shell命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。

[finance@master2-dev ~]$ cat 123.txt 
qwda
[finance@master2-dev ~]$ find 123* -ok cat {} \;
< cat ... 123.txt > ? yes
qwda
[finance@master2-dev ~]$ find 123* -exec cat {} \;
qwda
[finance@master2-dev ~]$ find 123*| xargs cat
qwda

4.4.命令选项:

-name   filename             #查找名为filename的文件
-perm #按执行权限来查找
-user username #按文件属主来查找
-group groupname #按组来查找
-mtime -n +n #按文件更改时间来查找文件,-n指n天以内,+n指n天以前
-atime -n +n #按文件访问时间来查GIN: 0px">
-ctime -n +n #按文件创建时间来查找文件,-n指n天以内,+n指n天以前
-nogroup #查无有效属组的文件,即文件的属组在/etc/groups中不存在
-nouser #查无有效属主的文件,即文件的属主在/etc/passwd中不存
-newer f1 !f2 找文件,-n指n天以内,+n指n天以前
-ctime -n +n #按文件创建时间来查找文件,-n指n天以内,+n指n天以前
-nogroup #查无有效属组的文件,即文件的属组在/etc/groups中不存在
-nouser #查无有效属主的文件,即文件的属主在/etc/passwd中不存
-newer f1 !f2 #查更改时间比f1新但比f2旧的文件
-type b/d/c/p/l/f #查是块设备、目录、字符设备、管道、符号链接、普通文件
-size n[c] #查长度为n块[或n字节]的文件
-depth #使查找在进入子目录前先行查找完本目录
-fstype #查更改时间比f1新但比f2旧的文件
-type b/d/c/p/l/f #查是块设备、目录、字符设备、管道、符号链接、普通文件
-size n[c] #查长度为n块[或n字节]的文件
-depth #使查找在进入子目录前先行查找完本目录
-fstype #查位于某一类型文件系统中的文件,这些文件系统类型通常可 在/etc/fstab中找到
-mount #查文件时不跨越文件系统mount点
-follow #如果遇到符号链接文件,就跟踪链接所指的文件
-cpio %; #查位于某一类型文件系统中的文件,这些文件系统类型通常可 在/etc/fstab中找到
-mount #查文件时不跨越文件系统mount点
-follow #如果遇到符号链接文件,就跟踪链接所指的文件
-cpio #对匹配的文件使用cpio命令,将他们备份到磁带设备中
-prune #忽略某个目录

-size n:[c] 查找文件长度为n块的文件,带有c时表示文件长度以字节计。-depth:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
-fstype:查找位于某一类型文件系统中的文件,这些文件系统类型通常可以在配置文件/etc/fstab中找到,该配置文件中包含了本系统中有关文件系统的信息。
-mount:在查找文件时不跨越文件系统mount点。
-follow:如果find命令遇到符号链接文件,就跟踪至链接所指向的文件。
-cpio:对匹配的文件使用cpio命令,将这些文件备份到磁带设备中。

另外,下面三个的区别:

-amin n   查找系统中最后N分钟访问的文件
-atime n  查找系统中最后n*24小时访问的文件
-cmin n   查找系统中最后N分钟被改变文件状态的文件
-ctime n  查找系统中最后n*24小时被改变文件状态的文件
-mmin n   查找系统中最后N分钟被改变文件数据的文件
-mtime n  查找系统中最后n*24小时被改变文件数据的文件

4.5.实例

4.5.1.使用name选项:

文件名选项是find命令最常用的选项,要么单独使用该选项,要么和其他选项一起使用。  可以使用某种文件名模式来匹配文件,记住要用引号将文件名模式引起来。  不管当前路径是什么,如果想要在自己的根目录$HOME中查找文件名符合*.log的文件,使用~作为 'pathname'参数,波浪号~代表了你的$HOME目录。

find ~ -name "*.log" -print  ------*表示  通配任意的字符      ?表示  通配任意的单个字符

想要在当前目录及子目录中查找所有的‘ *.log‘文件,可以用: 

find . -name "*.log" -print  

想要的当前目录及子目录中查找文件名以一个大写字母开头的文件,可以用:  

find . -name "[A-Z]*" -print  ---------[ ] 表示 通配括号里面的任意一个字符

想要在/etc目录中查找文件名以host开头的文件,可以用:  

find /etc -name "host*" -print  

如果想在当前目录查找文件名以一个个小写字母开头,最后是4到9加上.log结束的文件:  

[finance@master2-dev ~]$ find . -name "[a-z]*[4-9].log" -print
./script/hs_err_pid32186.log
./script/hs_err_pid19725.log
./script/hs_err_pid5736.log

4.5.2.用perm选项:

按照文件权限模式用-perm选项,按文件权限模式来查找文件的话。最好使用八进制的权限表示法。  

如在当前目录下查找文件权限位为755的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件,可以用:  

[finance@master2-dev ~]$ find . -perm 755 -print

还有一种表达方法:在八进制数字前面要加一个横杠-,表示都匹配,如-007就相当于777,-005相当于555,

4.5.3.忽略某个目录:

如果在查找文件时希望忽略某个目录,因为你知道那个目录中没有你所要查找的文件,那么可以使用-prune选项来指出需要忽略的目录。在使用-prune选项时要当心,因为如果你同时使用了-depth选项,那么-prune选项就会被find命令忽略。如果希望在test目录下查找文件,但不希望在test/test3目录下查找,可以用:  

命令:

find test -path "test/test3" -prune -o -print

[finance@master2-dev ~]$ find . -name *log
./nby/dm_rpt_070001_rds_d.log
./nby/rpt_sms_001_d_group.log
./nby/rpt_170006_ams_d.log
./nby/mls_epp_member_lab_info.log
./nby/rpt_170009_ams_d.log
./nby/bi_td.tsor_page_prmtr_enter_td.log
./nby/tmp_act_acct_info.log
./nby/rpt_170010_ams_d.log
./nby/bi_td.tsor_br_page_cate_td.log
./nby/dpa_pty_onl_rgst_info.log
./nby/finance.sor_mls_fnd_bill_order.log
./.sqoop/shared-metastore.db.log
./script/hs_err_pid30353.log
./script/hs_err_pid32186.log
./script/hs_err_pid19725.log
./script/log
./script/log/hiveserver2.log
./script/log/restartHiveServer2.log
./script/hs_err_pid5736.log
./syf/dm_rpt_090005_pcs_m.log
./syf/dm_rpt_090006_pcs_m.log
./syf/dm_rpt_090004_pcs_m.log
[finance@master2-dev ~]$ find . -path "./syf" -prune -o -name *log -print
./nby/dm_rpt_070001_rds_d.log
./nby/rpt_sms_001_d_group.log
./nby/rpt_170006_ams_d.log
./nby/mls_epp_member_lab_info.log
./nby/rpt_170009_ams_d.log
./nby/bi_td.tsor_page_prmtr_enter_td.log
./nby/tmp_act_acct_info.log
./nby/rpt_170010_ams_d.log
./nby/bi_td.tsor_br_page_cate_td.log
./nby/dpa_pty_onl_rgst_info.log
./nby/finance.sor_mls_fnd_bill_order.log
./.sqoop/shared-metastore.db.log
./script/hs_err_pid30353.log
./script/hs_err_pid32186.log
./script/hs_err_pid19725.log
./script/log
./script/log/hiveserver2.log
./script/log/restartHiveServer2.log
./script/hs_err_pid5736.log

实例2:避开多个文件夹:

[finance@master2-dev ~]$ find .  \(  -path "./syf" -o -path "./script" \)  -prune -o -name *log -print
./nby/dm_rpt_070001_rds_d.log
./nby/rpt_sms_001_d_group.log
./nby/rpt_170006_ams_d.log
./nby/mls_epp_member_lab_info.log
./nby/rpt_170009_ams_d.log
./nby/bi_td.tsor_page_prmtr_enter_td.log
./nby/tmp_act_acct_info.log
./nby/rpt_170010_ams_d.log
./nby/bi_td.tsor_br_page_cate_td.log
./nby/dpa_pty_onl_rgst_info.log
./nby/finance.sor_mls_fnd_bill_order.log
./.sqoop/shared-metastore.db.log

说明:

圆括号表示表达式的结合。  \ 表示引用,即指示 shell 不对后面的字符作特殊解释,而留给 find 命令去解释其意义。  

4.5.4.使用user和nouser选项:

按文件属主查找文件:

实例1:在$HOME目录中查找文件属主为finance的文件 

命令:

find ~ -user finance -print

实例2:在/etc目录下查找文件属主为peida的文件: 

命令:

find /etc/ -user finance -print

说明:

实例3:为了查找属主帐户已经被删除的文件,可以使用-nouser选项。在/home目录下查找所有的这类文件

命令:

find /home -nouser -print

说明:

这样就能够找到那些属主在/etc/passwd文件中没有有效帐户的文件。在使用-nouser选项时,不必给出用户名; find命令能够为你完成相应的工作。

4.5.5.使用group和nogroup选项:

就像user和nouser选项一样,针对文件所属于的用户组, find命令也具有同样的选项,为了在/home/finance目录下查找属于gem用户组的文件,可以用:  

find /home/finance/ -group finance -print  

要查找没有有效所属用户组的所有文件,可以使用nogroup选项。下面的find命令从文件系统的根目录处查找这样的文件:

find / -nogroup-print

4.5.6.按照更改时间或访问时间等查找文件:

如果希望按照更改时间来查找文件,可以使用mtime,atime或ctime选项。如果系统突然没有可用空间了,很有可能某一个文件的长度在此期间增长迅速,这时就可以用mtime选项来查找这样的文件。  

用减号-来限定更改时间在距今n日以内的文件,而用加号+来限定更改时间在距今n日以前的文件。  

希望在系统/home/finance/下查找更改时间在5日以内的文件,可以用:

[finance@master2-dev ~]$ find /home/finance/ -mtime -5 -print
/home/finance/
/home/finance/123.txt
/home/finance/.bash_history
/home/finance/data.txt
/home/finance/.viminfo
/home/finance/.subversion
/home/finance/.subversion/README.txt
/home/finance/.subversion/servers
/home/finance/.subversion/auth
/home/finance/.subversion/auth/svn.simple
/home/finance/.subversion/auth/svn.username
/home/finance/.subversion/auth/svn.ssl.server
/home/finance/.subversion/auth/svn.ssl.client-passphrase
/home/finance/.subversion/config
/home/finance/script
/home/finance/script/monitor_hiveserver2_leak.sh
/home/finance/script/log/hiveserver2.log

4.5.7.查找比某个文件新或旧的文件:

如果希望查找更改时间比某个文件新但比另一个文件旧的所有文件,可以使用-newer选项。

它的一般形式为:  

newest_file_name ! oldest_file_name  

其中,!是逻辑非符号。  

[finance@master2-dev nby]$ ll
total 500
-rw-r--r-- 1 finance finance 123029 Dec 18 2015 170006.csv
-rw-r--r-- 1 finance finance 4144 Dec 18 2015 170007.csv
-rw-r--r-- 1 finance finance 21075 Dec 18 2015 170009.csv
-rw-r--r-- 1 finance finance 135309 Dec 18 2015 170010.csv
-rw-rw-r-- 1 finance finance 6811 Jun 16 2015 bi_td.tsor_br_page_cate_td.log
-rw-rw-r-- 1 finance finance 6842 Jun 16 2015 bi_td.tsor_page_prmtr_enter_td.log
-rw-r--r-- 1 finance finance 129 Apr 21 2015 bsn.txt
-rw-rw-r-- 1 finance finance 22942 Apr 22 2015 dm_rpt_070001_rds_d.log
-rw-rw-r-- 1 finance finance 25510 Aug 18 2015 dpa_pty_onl_rgst_info.log
-rw-rw-r-- 1 finance finance 167 Apr 21 2015 finance.csv
-rw-rw-r-- 1 finance finance 751 Apr 1 2015 finance.sor_mls_fnd_bill_order.log
-rw-rw-r-- 1 finance finance 126 Apr 21 2015 finance.txt
-rw-rw-r-- 1 finance finance 5326 Jun 10 2015 mls_epp_member_lab_info.log
-rw-r--r-- 1 finance finance 30 Apr 21 2015 nat.txt
-rw-rw-r-- 1 finance finance 24983 Dec 18 2015 rpt_170006_ams_d.log
-rw-rw-r-- 1 finance finance 24424 Dec 18 2015 rpt_170009_ams_d.log
-rw-rw-r-- 1 finance finance 24495 Dec 18 2015 rpt_170010_ams_d.log
-rw-rw-r-- 1 finance finance 513 Jun 10 2015 rpt_sms_001_d_group.log
-rw-r--r-- 1 finance finance 83 Apr 21 2015 rule.txt
-rw-rw-r-- 1 finance finance 24856 Aug 18 2015 tmp_act_acct_info.log
[finance@master2-dev nby]$ find -newer bi_td.tsor_br_page_cate_td.log
.
./170006.csv
./rpt_170006_ams_d.log
./170009.csv
./170010.csv
./rpt_170009_ams_d.log
./170007.csv
./bi_td.tsor_page_prmtr_enter_td.log
./tmp_act_acct_info.log
./rpt_170010_ams_d.log
./dpa_pty_onl_rgst_info.log
[finance@master2-dev nby]$ find ! -newer bi_td.tsor_br_page_cate_td.log
./dm_rpt_070001_rds_d.log
./rpt_sms_001_d_group.log
./finance.csv
./mls_epp_member_lab_info.log
./bsn.txt
./finance.txt
./nat.txt
./bi_td.tsor_br_page_cate_td.log
./rule.txt
./finance.sor_mls_fnd_bill_order.log
[finance@master2-dev nby]$ find -newer bi_td.tsor_br_page_cate_td.log ! -newer bi_td.tsor_page_prmtr_enter_td.log
./bi_td.tsor_page_prmtr_enter_td.log
[finance@master2-dev nby]$ find -newer bi_td.tsor_br_page_cate_td.log ! -newer 170006.csv
./170006.csv
./170009.csv
./170010.csv
./bi_td.tsor_page_prmtr_enter_td.log
./tmp_act_acct_info.log
./dpa_pty_onl_rgst_info.log

4.5.8.使用type选项:

实例1:在/etc目录下查找所有的目录  

命令:

[finance@master2-dev ~]$ find  -type d
.
./20160427
./export_temp_dpa_rist_cust_init.txt
./fanghh
./fanghh/lx
./fanghh/script
./nby
./jars
./.gnome2
./.gnome2/keyrings
./.sqoop
./.subversion
./.subversion/auth
./.subversion/auth/svn.simple
./.subversion/auth/svn.username
./.subversion/auth/svn.ssl.server
./.subversion/auth/svn.ssl.client-passphrase
./script
./script/log
./.ssh
./syf
./tmp
./mls

实例2:在当前目录下查找除目录以外的所有类型的文件  

命令:

[finance@master2-dev ~]$ find . ! -type d -print 
./.history
./123.txt
./.bashrc
./export_temp_dpa_rist_cust_init.txt/.000000_0.deflate.crc
./export_temp_dpa_rist_cust_init.txt/000001_0.deflate
./export_temp_dpa_rist_cust_init.txt/.000001_0.deflate.crc
./export_temp_dpa_rist_cust_init.txt/000000_0.deflate
./%s
./fanghh/test.py
./fanghh/rules.py
./fanghh/lx/dm_app_finance_service_daily_data_20160804.csv
./fanghh/script/dm_rpt_130019_fsa_web_02_d.sql
./fanghh/script/dpa_fsa_br_base_pageview.sql
./fanghh/script/dm_rpt_130016_fsa_web_01_d.sql
./fanghh/script/dm_rpt_130014_fsa_web_d.sql
......

实例3:在当前目录下查找所有的符号链接文件

命令:

[finance@master2-dev ~]$ find -type l -print
./workspace

4.5.9.使用size选项:

可以按照文件长度来查找文件,这里所指的文件长度既可以用块(block)来计量,也可以用字节来计量。以字节计量文件长度的表达形式为N c;以块计量文件长度只用数字表示即可。  

在按照文件长度查找文件时,一般使用这种以字节表示的文件长度,在查看文件系统的大小,因为这时使用块来计量更容易转换。  

实例1:在当前目录下查找文件长度大于1 M字节的文件  

命令:

[finance@master2-dev ~]$ find . -size +1000000c -print
./fanghh/script/dpa_cde_fsa_br_utm_src.init
./fanghh/hadoop-0.0.1-jar-with-dependencies.jar
./jars/spark-assembly-1.4.0-hadoop2.4.0.jar
./script/log/hiveserver2.log
./tmp/export_dpa_crd_cshop_main_info.txt

实例2:在/home/apache目录下查找文件长度恰好为100字节的文件:  

命令:

find /home/apache -size 100c -print  

实例3:在当前目录下查找长度超过10块的文件(一块等于512字节) 

命令:

find . -size +10 -print

4.5.10.使用depth选项:

在使用find命令时,可能希望先匹配所有的文件,再在子目录中查找。使用depth选项就可以使find命令这样做。这样做的一个原因就是,当在使用find命令向磁带上备份文件系统时,希望首先备份所有的文件,其次再备份子目录中的文件。  

实例1:find命令从文件系统的根目录开始,查找一个名为CON.FILE的文件。   

命令:

find / -name "CON.FILE" -depth -print

说明:

它将首先匹配所有的文件然后再进入子目录中查找

4.5.11.使用mount选项: 

  在当前的文件系统中查找文件(不进入其他文件系统),可以使用find命令的mount选项。

实例1:从当前目录开始查找位于本文件系统中文件名以XC结尾的文件  

命令:

find . -name "*.XC" -mount -print