Python基础知识（26）：常用内建模块（Ⅱ）

1、hashlib

Python的hashlib提供了常见的摘要算法，如MD5，SHA1等

摘要算法又称哈希算法、散列算法。

（1）它通过一个函数，把任意长度的数据转换为一个长度固定的数据串（通常用16进制的字符串表示）

（2）摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest，目的是为了发现原始数据是否被人篡改过

MD5

MD5是最常见的摘要算法，速度很快，生成结果是固定的128 bit字节，通常用一个32位的16进制字符串表示

import hashlib
md5 = hashlib.md5()
md5.update('How to use md5 in python hashlib'.encode('utf-8'))
print(md5.hexdigest())

结果：
8b6e4d30c576051f3ca4be97e8314d15

SHA1

import hashlib
sha1 = hashlib.sha1()
sha1.update('How to use SHA1 in python hashlib'.encode('utf-8'))
print(sha1.hexdigest())

结果：
8a4dbc942c7ff059115b56645ab484c4188bd5ce

SHA1的结果是160 bit字节，通常用一个40位的16进制字符串表示

比SHA1更安全的算法是SHA256和SHA512，不过越安全的算法不仅越慢，而且摘要长度更长

摘要算法的应用

用户登录网站的用户名和口令都存储数据库，口令使用摘要算法进行加密

当用户登录时，首先计算用户输入的明文口令的MD5，然后和数据库存储的MD5对比，如果一致，说明口令输入正确，如果不一致，口令肯定错误

要确保存储的用户口令不是那些已经被计算出来的常用口令的MD5，这一方法通过对原始口令加一个复杂字符串来实现，俗称“加盐

经过Salt处理的MD5口令，只要Salt不被黑客知道，即使用户输入简单口令，也很难通过MD5反推明文口令

设计一个验证用户登录的函数，根据用户输入的口令是否正确

import hashlib
db = {
    'michael': 'e10adc3949ba59abbe56e057f20f883e',
    'bob': '878ef96e86145580c38c87f0410ad153',
    'alice': '99b1c2188db85afee403b1536010c2c9'
}
def calc_md5(password):
    md5 = hashlib.md5()
    md5.update(password.encode('utf-8'))
    return md5.hexdigest()
def login(user, password):
    md5 = calc_md5(password)
    if user in db and md5 in db.get(user):
        print('Welcome')
    else:
        print('Incorrect username or password')

login('michael', '123456')
login('bob', 'abc999')
login('alice', 'alice2008')
login('michael', '1234567')
login('bob', '123456')
login('alice', 'Alice2008')

结果：
Welcome
Welcome
Welcome
Incorrect username or password
Incorrect username or password
Incorrect username or password

HMAC是密钥相关的哈希运算消息认证码，HMAC运算利用哈希算法，以一个密钥和一个消息为输入，生成一个消息摘要作为输出

Python自带的hmac模块实现了标准的Hmac算法，它利用一个key对message计算“杂凑”后的hash，使用hmac算法比标准hash算法更安全，因为针对相同的message，不同的key会产生不同的hash

import hmac
message = b'Hello,world!'
key = b'secret'
h = hmac.new(key, message, digestmod='MD5')
print(h.hexdigest())

结果：
21db988f124ebc9fade5492afb9df52d

3、itertools

Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数

（1）count

count()会创建一个无限的迭代器，所以上述代码会打印出自然数序列，根本停不下来，只能按Ctrl+C退出

import itertools
natuals = itertools.count(1)
for i in natuals:
    print(i)

（2）cycle

cycle()会把传入的一个序列无限重复下去

import itertools
cs = itertools.cycle('ABC')
for i in cs:
    print(i)

（3）repeat

repeat()负责把一个元素无限重复下去，不过如果提供第二个参数就可以限定重复次数

import itertools
ns = itertools.repeat('A', 3)
for i in ns:
    print(i)

结果：
A
A
A

（4）takewhile

无限序列只有在for迭代时才会无限地迭代下去，如果只是创建了一个迭代对象，它不会事先把无限个元素生成出来，事实上也不可能在内存中创建无限多个元素

无限序列虽然可以无限迭代下去，但是通常我们会通过takewhile()等函数根据条件判断来截取出一个有限的序列

import itertools
natuals = itertools.count(1)
ns = itertools.takewhile(lambda x:x<=10, natuals)
for i in ns:
    print(i)

结果：
1
...
10

（5）chain

chain()可以把一组迭代对象串联起来，形成一个更大的迭代器

import itertools
for c in itertools.chain('ABC','123'):
    print(c)

结果：
A
B
C
1
2
3

（6）groupby

groupby()把迭代器中相邻的重复元素挑出来放在一起

实际上挑选规则是通过函数完成的，只要作用于函数的两个元素返回的值相等，这两个元素就被认为是在一组的，而函数返回值作为组的key

如果我们要忽略大小写分组，就可以让元素'A'和'a'都返回相同的key

import itertools
for key,group in itertools.groupby('monent'):
    print(key,list(group))

for key,group in itertools.groupby('AAaaaBBBbbccC', lambda c:c.upper()):
    print(key,list(group))

结果：
m ['m']
o ['o']
n ['n']
e ['e']
n ['n']
t ['t']
A ['A', 'A', 'a', 'a', 'a']
B ['B', 'B', 'B', 'b', 'b']
C ['c', 'c', 'C']

4、contextlib

在Python中，读写文件这样的资源要特别注意，必须在使用完毕后正确关闭它们。正确关闭文件资源的一个方法是使用try...finally

写try...finally非常繁琐，使用Python的with语句更加方便

#try..finally...
try:
    f = open('/path/to/file', 'r')
    f.read()
finally:
    if f:
        f.close()

#with
with open('/path/to/file', 'r') as f:
    f.read()

实现上下文管理是通过__enter__和__exit__这两个方法实现的，任何对象只要正确实现了上下文管理，就可以用于with语句

@contextmanager

编写__enter__和__exit__仍然很繁琐，因此Python的标准库contextlib提供了更简单的写法

@closing

如果一个对象没有实现上下文，我们就不能把它用于with语句。这个时候，可以用closing()来把该对象变为上下文对象

秒客网

Python学习之旅（二十七）