linux 命令之comm

时间:2021-01-10 20:54:42
1. 简介

comm命令可以用于两个文件之间的比较,它有一些选项可以用来调整输出,以便执行交集、求差、以及差集操作。

  • 交集:打印出两个文件所共有的行。

  • 求差:打印出指定文件所包含的且不相同的行。

  • 差集:打印出包含在一个文件中,但不包含在其他指定文件中的行。

2. 语法

  1. comm (选项) (参数)
3. 选项
  • -1:不显示在第一个文件出现的内容

  • -2:不显示在第二个文件中出现的内容

  • -3:不显示同时在两个文件中都出现的内容

4. 参数
  • 文件1:指定要比较的第一个有序文件

  • 文件2:指定要比较的第二个有序文件

5. 实例

~/company/sh$ cat 1.txt

1a
1b
1c
1d
1f
1e
3a
3b
3c

~/company/sh$ cat 2.txt

2a
2b
2c
2d
2e
2f
3a
3b
3c

(1)无选项:输出的第一列只包含在1.txt中出现的行,第二列包含在2.txt中出现的行,第三列同时包含在1.txt和2.txt中的行。各列是以制表符(\t)作为定界符。

~/company/sh$ omm 1.txt 2.txt

1a
1b
1c
1d
1f
1e
  2a
  2b
  2c
  2d
  2e
  2f
    3a
    3b
    3c

(2)-1选项(可以理解为-1删除第一列,-2删除第二列):不显示只在第一个文件出现的内容,输出的第一列只包含在2.txt中出现的行,第二列同时包含在1.txt和2.txt中的行

~/company/sh$ comm -1 1.txt 2.txt

2a
2b
2c
2d
2e
2f
  3a
  3b
  3c

(3)交集:第三列就是交集的内容,只需删除第一列和第二列内容即可

~/company/sh$ comm -1 -2 1.txt 2.txt

3a
3b
3c

(4)求差:打印出两个文件中不相同的行,需要删除第三列,sed 's/^\t//' 是将制表符(\t)删除,以便把两列合并成一列。

~/company/sh$ comm -3 1.txt 2.txt

1a
1b
1c
1d
1f
1e
  2a
  2b
  2c
  2d
  2e
  2f

~/company/sh$ comm -3 1.txt 2.txt|sed 's/^\t//' 

1a
1b
1c
1d
1f
1e
2a
2b
2c
2d
2e
2f

(5)差集

a.txt的差集

~/company/sh$ comm -2 -3 1.txt 2.txt

1a
1b
1c
1d
1f
1e

b.txt差集

~/company/sh$ comm -1 -3 1.txt 2.txt

2a
2b
2c
2d
2e
2f