shell使用汇总4——文件内容统计命令

时间:2022-04-26 03:33:02

 文件内容统计命令

  wc命令

  wc命令的功能为统计指定文件中的字节数、字数、行数, 并将统计结果显示输出。

  语法:wc [选项] 文件…

  说明:该命令统计给定文件中的字节数、字数、行数。如果没有给出文件名,则从标准输入读取。wc同时也给出所有指定文件的总统计数。字是由空格字符区分开的最大字符串。

  该命令各选项含义如下:

  - c 统计字节数。

  - l 统计行数。

  - w 统计字数。

  这些选项可以组合使用。

  输出列的顺序和数目不受选项的顺序和数目的影响。总是按下述顺序显示并且每项最多一列。

  行数、字数、字节数、文件名

  如果命令行中没有文件名,则输出中不出现文件名。

  例如:

  $ wc - lcw file1 file2

  4 33 file1

  7 52 file2

  11 11 85 total

  省略任选项-lcw,wc命令的执行结果与上面一样。


  第十课(五) 文件比较命令 


  这组命令可以用来比较两个文件内容的差别。

  Comm命令

  如果想对两个有序的文件进行比较,可以使用comm命令。

  语法:comm [- 123 ] file1 file2

  说明:该命令是对两个已经排好序的文件进行比较。其中file1和file2是已排序的文件。comm读取这两个文件,然后生成三列输出:仅在file1中出现的行;仅在file2中出现的行;在两个文件中都存在的行。如果文件名用“- ”,则表示从标准输入读取。

  选项1、2或3抑制相应的列显示。例如comm - 12就只显示在两个文件中都存在的行;comm - 23只显示在第一个文件中出现而未在第二个文件中出现的行;comm - 123则什么也不显示。

  例如:假设要对文件myfile1和myfile2进行比较

  $ cat myfile1

  main( )
  {

  float a,b, i, j ,z ;

  a=i=10 ; b=j=5 ;

  z= i + j ;

  printf(“z=%d/n”,z) ;

  }

  $ cat myfile2

  #include

  main( )

  {

  float i, j ,z ;

  i=10 ; j=5 ;

  z= i + j ;

  printf(“z=%f/n”,z) ;

  }

  $ comm - 12 myfile1 myfile2

  main( )

  {

  z= i + j ;

  }

  就只显示文件myfile1和myfile2*有的行。

  Diff命令

  该命令的功能为逐行比较两个文本文件,列出其不同之处。它比comm命令完成更复杂的检查。它对给出的文件进行系统的检查,并显示出两个文件中所有不同的行,不要求事先对文件进行排序。

  语法:diff [选项] file1 file2

  说明:该命令告诉用户,为了使两个文件file1和file2一致,需要修改它们的哪些行。如果用“- ”表示file1或fiie2,则表示标准输入。如果file1或file2是目录,那么diff将使用该目录中的同名文件进行比较。例如:

  diff /usr/xu mine

  把目录/usr/xu 中名为mine的文件与当前目录中的mine文件进行比较。

  通常输出由下述形式的行组成:

  n1 a n3,n4

  n1,n2 d n3

  n1,n2 c n3,n4

  这些行类似ed命令把filel转换成file2。字母(a、d和c)之前的行号(n1,n2)是针对file1的,其后面的行号(n3,n4)是针对file2的。字母a、d和c分别表示附加、删除和修改操作。

  在上述形式的每一行的后面跟随受到影响的若干行,以“<”打头的行属于第一个文件,以“>”打头的行属于第二个文件。

  diff能区别块和字符设备文件以及FIFO(管道文件),不会把它们与普通文件进行比较。

  如果file1和file2都是目录,则diff会产生很多信息。如果一个目录中只有一个文件,则产生一条信息,指出该目录路径名和其中的文件名。

  diff各选项的含义如下:

  - b 忽略行尾的空格,而字符串中的一个或多个空格符都视为相等。如How are you与How are you被视为相同的字符串。

  - c 采用上下文输出格式(提供三行上下文)。

  - C n 采用上下文输出格式(提供n行上下文)。

  - e 产生一个合法的ed脚本作为输出。

  - r 当file1和file2是目录时,递归作用到各文件和目录上。

  例如,文件ml.c的内容为(左边行号是有意加上的,以便前后对照):

  1 main( )
  {
          printf(“Hello!\n”);
  }

  5

  文件m2.c的内容为:

  1 main()

  2 {

      3     int n , m ;

      4     n= 10 ;

      5     printf ( “ % d / n ” , m = n * 10);

  6 }

  输入命令:

  $ diff m1.c m2.c

  屏幕上显示:

  3,5 c 3,6


  printf(“Hello!\n”);


  }

  <5

  >3 int n,m;

  >4 n=10 ;

  >5 printf ( “ % d / n ” , m = n * 10);

  >6 }

 

  表示把文件m1.c的3至5行改成m2.c的3至6行后,两个文件相同。

原文出自http://www.linuxsir.org/bbs/showthread.php?s=&threadid=5107
文章出处:http://www.diybl.com/course/6_system/linux/Linuxjs/20081012/150322.html