一、校验与核实

目前最为出名的校验技术是md5sum和sha1sum,它们对文件内容使用相应的算法来生成校验和。

举例：

amosli@amosli-pc:~/learn$ md5sum text.txt 
186931e2ff7cb0cde2c17b2298be604c  text.txt

如上所示，使用md5sum生成了一个由32个字符组成的十六进制串。

可以将输出的校验重定向到一个文件中，然后再用这个md5文件来核实数据的完整性：

amosli@amosli-pc:~/learn$ md5sum text.txt > md5_text.txt
amosli@amosli-pc:~/learn$ cat md5_text.md5 
186931e2ff7cb0cde2c17b2298be604c  text.txt

md5sum的计算方法：

md5sum file1 file2 file3 ...

举例：

amosli@amosli-pc:~/learn$ md5sum text.txt out.txt output.txt 
186931e2ff7cb0cde2c17b2298be604c  text.txt
ce4ff16bd0044c0831a83fc1eca981eb  out.txt
8a6b721e2d5925b78a4c8f4c82dda4bf  output.txt

如何检验文件是否所提供的.md5相匹配？

amosli@amosli-pc:~/learn$ md5sum -c md5_text.md5 
text.txt: OK

SHA1是另一种常用的算法，与md5极为相似。

举例：

amosli@amosli-pc:~/learn$ sha1sum text.txt 
30ede30817e1d3a8a15d903187899c2bccd7ad8f  text.txt
amosli@amosli-pc:~/learn$ sha1sum text.txt > sha1_text.sha1
amosli@amosli-pc:~/learn$ sha1sum -c sha1_text.sha1 
text.txt: OK

不同的是sha1输出的是长度为40位的十六进制串，另外，文件后缀名也由.md5改为sha1。

二、排序、单一和重复

sort命令进行排序，uniq命令是从stdin（标准输入）或文本中提取单一的行，sort和uniq能够用来查找重复的数据.

举例：

sum.txt

amosli@amosli-pc:~/learn$ cat sum.txt 
5
4
3
5
4
3

对sum.txt进行默认排序：

amosli@amosli-pc:~/learn$ sort sum.txt 
3
3
4
4
5
5

去除sum.txt中的重复数值：

amosli@amosli-pc:~/learn$ sort sum.txt | uniq
3
4
5

sort命令详解：

１、按数字进行排序，参数-n

sort -n file.txt

上面举例即是按数字进行排序的。

２、按逆序进行排序,参数-r

sort -r file.txt

举例：

amosli@amosli-pc:~/learn$ sort -r sum.txt 
5
5
4
4
3
3

３、按月份进行排序，参数-M

sort -M months.txt

举例：

amosli@amosli-pc:~/learn$ cat  months.txt
一月
十月
五月

amosli@amosli-pc:~/learn$ sort -M months.txt 

一月
五月
十月

４、合并排序过的文件，-m参数

sort -m sorted1 sorted2

如果需要合并两个排过序的文件，而且不需要对合并后的文件再进行排序，可以使用如上式子。

５、依据键或列进行排序,-k参数

举例：

data.txt

amosli@amosli-pc:~$ cat data.txt 
1 mac 2000
2 winxp 4000
3 win8.1 1000
4 linux 1000

-k指定了排序应该执照哪一个键(key)来进行。键指的是列号。

如下：

１）按第１列，逆序排列

amosli@amosli-pc:~$ sort -nrk 1 data.txt
4 linux 1000
3 win8.1 1000
2 winxp 4000
1 mac 2000

２）按第２列排列

amosli@amosli-pc:~$ sort -k 2 data.txt 

4 linux 1000
1 mac 2000
3 win8.1 1000
2 winxp 4000

６、其他参数

-z参数，为了使sort的输出与以'\0' 作为参数终止符的xargs命令相兼容，采用下面的命令:

sort -z data.txt | xargs -0

amosli@amosli-pc:~$ sort -z data.txt | xargs -0
1 mac 2000
2 winxp 4000
3 win8.1 1000
4 linux 1000

-b参数,用于忽略文件中的前导空白字符，-d参数用于指明以字典序进行排序。

amosli@amosli-pc:~$ sort -bd data.txt 

1 mac 2000
2 winxp 4000
3 win8.1 1000
4 linux 1000

uniq命令详解：

uniq命令用于通过消除重复内容，只能用于排过序的数据输入，因此，uniq要么使用管道，要么将排过序的文件作为输入。

举例：

sorted.txt

amosli@amosli-pc:~$ cat sorted.txt 
hi
amos
hi
bash

使用uniq过滤重复的值

amosli@amosli-pc:~$ sort sorted.txt | uniq

amos
bash
hi

１、参数-u，只显示唯一的行（在输入文件中没有出现重复的行）

amosli@amosli-pc:~$ sort sorted.txt | uniq -u

amos
bash

２、参数-c，统计各行在文件中出现的次数

amosli@amosli-pc:~$ sort sorted.txt | uniq -c
1 
1 amos
1 bash
2 hi

３、参数-d,查找文件中出现重复的行

amosli@amosli-pc:~$ sort sorted.txt | uniq -d
hi

４、参数-s,-w指定键

-s 指定可以跳过前Ｎ个字符；

-w指定用于比较的最大字符数。

举例：

da.txt

amosli@amosli-pc:~$ cat da.txt 
u:01:gnu
d:04:linux
u:01:bash
u:01:hack

amosli@amosli-pc:~$ sort da.txt | uniq -s 2 -w 2

d:04:linux
u:01:bash

忽略前２个字符(-s 2),指定用于比较的最大字符数方式来选定该键(-w 2)

5.-z参数，生成包含0值字节终止符的输出，与sort -z命令类似

amosli@amosli-pc:~$ uniq -z da.txt
u:01:gnu
d:04:linux
u:01:bash
u:01:hack

秒客网

linux shell 脚本攻略学习8---md5校验，sort排序,uniq命令详解

一、校验与核实

二、排序、单一和重复

sort命令详解：

１、按数字进行排序，参数-n

２、按逆序进行排序,参数-r

３、按月份进行排序，参数-M

举例：

４、合并排序过的文件，-m参数

５、依据键或列进行排序,-k参数

uniq命令详解：

１、参数-u，只显示唯一的行（在输入文件中没有出现重复的行）

２、参数-c，统计各行在文件中出现的次数

３、参数-d,查找文件中出现重复的行

４、参数-s,-w指定键

5.-z参数，生成包含0值字节终止符的输出，与sort -z命令类似

相关文章