Linux 查找文本工具grep

时间:2022-01-17 08:54:34


gerp基本格式

grep [option] pattern [file]

grep工具在文件file中查找与字符串pattern匹配的字符,如果找到,则将整行输出到标准输出。

常用选项

i:忽略大小写

n:将结果输出的同时,也输出该行的行号

s:在没有查找到的匹配的内容时,不显示错误信息

l:从多个文件中查找时,只输出找到匹配内容的的文件名称

h:从多个文件中查找时,只输出匹配的内容,不显示文件名称

c:只输出匹配内容的总行数

v:反转查找,即输出匹配内容以外的行

grep工作时,总是以行为单位查找。首先将文本的第1行读入缓冲区并执行查找,如果找到匹配的字符串,则输出整行。否则就丢弃缓冲区内容并读入下一个文本行继续查找,知道文本结束。


#############################################################3


使用grep查找文本

查看students的内容

使用cat命令查看文件students的内容

cat students


1.查找关键字

与使用搜索引擎一样,使用grep命令查找时,需要提供一个关键字。为了保证查找的效率,应该尽量选择一个“独一无二”的关键字,以避免查找到无关的信息。

#grep "92" students


2.显示行号

有时可能需要确定查找到的结果处于文本的社么位置,这时可以配合选项n在查找时输出行号

输出结果的同时输出行号

#grep -n "92" students


3.统计结果

统计文件中一共有多少名来自*的学生

#grep -c "Xizang" students


4.大小写敏感

grep命令继承了Linux系统对大小写字母敏感的特性,因此如果要使grep在查询过程中不区分大小写,应该配合使用i选项

使用选项i查找时忽略大小写

#grep -i "tangwei" students


5.反转查找

有时需要进行反转查找,即显示那些不匹配字符串的行,此时可以配合选项v

#grep -vi "tangwei" students | grep -vi "lixia"


6.多文件查找

有时需要从多个文件中查询一些相关联的内容,这时就要用到多文件查询。

显示/etc目录中所有包含有root的文件名

#grep -l "root" /etc/*


查询密码文件/etc/passwd和影子文件/etc/shadow中含有字符串root的所有行,并且不显示文件名称

#grep -h "root" /etc/passwd /etc/shadow


7在输出命令和变量中查找

grep不仅可以从文件中查询字符串,还可以从字符串和字符串变量中查询

使用grep在命令输出中查找

#echo "Welcome to Beijin" | grep "to Beijin"

使用grep在变量中查找

#A="Welcome to Beijin"

#echo $A | grep "Beijin"

使用变量保存查找的字符串

#A="Beijin"

#echo "Welcome to Beijin" | grep "$A"


note:在使用grep查找时,被查找的字符串可以不使用引号,但在被查找的字符串中有空格或被查询的字符串保存在一个变量中时,应该使用引号以免被grep误解为一个命令或参数

////////////////////////////////////////////////////////////////////////////////////////////////////////////////


行首、行尾匹配查找

文本的行首、行尾通常用于保存特殊意义的字段,因此从行首和行尾匹配查找可能会比较频繁


1.行首匹配

使用行首匹配符显示所有行首字符串为28的字符

#grep '^28' students

使用行首匹配符显示第5、6个字符为02的所有行

#grep '^....02' students


2.行尾匹配

使用选项v反转显示行尾大于85的行

grep -v '[0-7][0-9]$' students | grep -v '8[0-4]$'


///////////////////////////////////////////////////////////////////////////////////////////////////////////////////


配合常用的正则表达式查找

1.使用范围模式匹配

使用范围匹配符查找所有93年之后出生的学生

使用/9[3-9]这样的方式避免匹配到成绩

#grep '/9[3-9]' students

2.次数匹配模式

使用cat命令查看示例文件file.txt的内容

#cat file.txt

sleep 

sleepdddddd

bbbbbbbd


cccd


查找字母c至少重复出现2次的所有行:

使用次数匹配模式查找字母c至少出现2次的行

#grep 'c\{3,\}' file.txt


查找字母e重复出现2次且以p结尾的行:

#grep 'e\{2\}p$' file.txt


查找字母b重复出现2到10次的:

#grep 'b\{2, 10\}' file.txt


查找文件“file.txt”中有多少个空行

#grep -c '^$' file.txt


3.处理特殊字符

在使用grep查找的过程中,可能会遇到一些特殊符号,可以使用反斜线“'\”屏蔽掉这些特殊字符的含义

#ls -l | grep '\.txt$'


note:在结合正则表达式进行查询时,正则表达式可以不使用单引号。但为了避免被grep误解,最好将正则表达式放在单引号内


///////////////////////////////////////////////////////////////////////////////////////////////


使用或、与多匹配模式查找

有时需要进行多匹配模式查找,即在同一条命令中使用多个匹配模式。多匹配模式的关系可以是或匹配模式(即只满足一个匹配模式即可),也可以使与匹配模式(即需要满足所有匹配模式)。

1.或匹配模式

使用参数E让grep命令将要匹配的字符串延伸为一个普通的表达式,此时可以使用竖线“|” 表示或匹配模式,即只需要匹配两个字符串中的任意一个即可

查询来自河南和云南的学生的详细情况:

#grep -E 'Henan|Yunnan' students


2.与匹配模式

然而参数E并不支持与匹配模式查询,此时可以使用多条件管道实现。

要查询Lixia的学生中有哪些来自Sichuan:

#grep -i 'Lixia' students | grep "Sichuan"