Shell命令-文件及内容处理之grep(egrep)、join

时间:2023-12-15 11:44:08

文件及内容处理 - grep(egrep)、join

1. grep(egrep):文本过滤工具

grep(egrep)命令的功能说明

grep命令是Linux系统中最重要的命令之一,其功能是从文本文件或管道数据流中筛选匹配的行及数据,如果配合正则表达式技术一起使用,则功能更加强大。egrepgrep 的扩展正则,后面讲三剑客时会讲的。

grep命令的语法格式

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
grep [-abcEFGhHilLnqrsvVwxy][-A][-B][-C][-d][-e][-f][--help][范本样式][文件或目录...]

grep命令的常用参数说明:

grep 参数很多,表1为 grep 命令的参数及说明:

表1: grep 命令的参数及说明

参数选项 解释说明
-a 或 --text 不要忽略二进制的数据。
-A 或 --after-context= 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
-b 或 --byte-offset 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
-B 或 --before-context= 除了显示符合样式的那一行之外,并显示该行之前的内容。
-c 或 --count 计算符合样式的列数。
-C 或 --context=或- 除了显示符合样式的那一行之外,并显示该行之前后的内容。
-d 或 --directories= 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e 或 --regexp= 指定字符串做为查找文件内容的样式。
-E 或 --extended-regexp 将样式为延伸的普通表示法来使用。
-f 或 --file= 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
-F 或 --fixed-regexp 将样式视为固定字符串的列表。
-G 或 --basic-regexp 将样式视为普通的表示法来使用。
-h 或 --no-filename 在显示符合样式的那一行之前,不标示该行所属的文件名称。
-H 或 --with-filename 在显示符合样式的那一行之前,表示该行所属的文件名称。
-i 或 --ignore-case 忽略字符大小写的差别。
-l 或 --file-with-matches 列出文件内容符合指定的样式的文件名称。
-L 或 --files-without-match 列出文件内容不符合指定的样式的文件名称。
-n 或 --line-number 在显示符合样式的那一行之前,标示出该行的列数编号。
-o 或 --only-matching 只显示匹配PATTERN 部分。
-q 或 --quiet或--silent 不显示任何信息。
-r 或 --recursive 此参数的效果和指定"-d recurse"参数相同。
-s 或 --no-messages 不显示错误信息。
-v 或 --revert-match 显示不包含匹配文本的所有行。
-V 或 --version 显示版本信息。
-w 或 --word-regexp 只显示全字符合的列。
-x --line-regexp 只显示全列符合的列。
-y 此参数的效果和指定"-i"参数相同。

grep命令的实践操作

范例1: –v 参数实践

[root@oldboyedu  ~]#cat 1.txt
1
2
3
[root@oldboyedu  ~]# grep -v "2" 1.txt
1
3
[root@oldboyedu  ~]#

范例2: -n 参数实践

[root@oldboyedu  ~]# cat 2.txt
aa
aa
bb
cc
dd
ee
ff
bb
cc
dd
ee
ff
[root@oldboyedu  ~]# grep -n "cc" 2.txt
4:cc
9:cc
[root@oldboyedu  ~]#

范例3: -i参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep "c" 3.txt
cc
cA
[root@oldboyedu  ~]# grep -i "c" 3.txt
cc
cA
bC
[root@oldboyedu  ~]#

范例4: -E'--color'的参数实践

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -Ei --color=auto "a|c" 3.txt
aa
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]#

范例5: -c 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -c "c" 3.txt
2
[root@oldboyedu  ~]#

范例6: -o 参数实战

[root@oldboyedu  ~]# cat 3.txt
aa
bb
cc
Ab
Ba
cA
bC
[root@oldboyedu  ~]# grep -o "c" 3.txt
c
c
c
[root@oldboyedu  ~]#

2. join:按两个文件的相同字段合并

join命令的功能说明

join 命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。

join命令的语法格式

join [OPTION]... FILE1 FILE2
join [-i][-a<1或2>][-e][-o][-t][-v<1或2>][-1][-2][--help][--version][文件1][文件2]

join命令的常用参数说明:

join 参数,表1为 join 命令的参数及说明:

表1: join 命令的参数及说明

参数选项 解释说明
-a<1或2> 除了显示原来的输出内容之外,还显示指令文件中没有相同栏位的行。
-e 若[文件1]与[文件2]中找不到指定的栏位,则在输出中填入选项中的字符串。
-i或--igore-case 比较栏位内容时,忽略大小写的差异。
-o 按照指定的格式来显示结果。
-t 使用栏位的分隔字符。
-v<1或2> 跟-a相同,但是只显示文件中没有相同栏位的行。
-1 连接[文件1]指定的栏位。
-2 连接[文件2]指定的栏位。
--help 显示帮助。
--version 显示版本信息。

join命令的实践操作

范例1: 连接两个文件。

--------------------------------------------------------------
==>首先查看 testfile_1、testfile_2 中的文件内容<==
--------------------------------------------------------------
[root@oldboyedu ~]# cat testfile_1
Hello 95
Linux 85
test 30
[root@oldboyedu ~]# cat testfile_2
Hello 2005
Linux 2009
test 2006 

--------------------------------------------------------------
==>然后使用join命令,将两个文件连接<==
--------------------------------------------------------------
[root@oldboyedu ~]#  join testfile_1 testfile_2
Hello 95 2005
Linux 85 2009
test 30 2006 

--------------------------------------------------------------
==>文件1与文件2的位置对输出到标准输出的结果是有影响的<==
--------------------------------------------------------------
[root@oldboyedu ~]# join testfile_2 testfile_1
Hello 2005 95
Linux 2009 85
test 2006 30

今天就写到这里,有什么疑问或出现什么错误,随时欢迎大神们发表评论指点迷津