本文实例讲述了Python实现通过文件路径获取文件hash值的方法。分享给大家供大家参考,具体如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
import hashlib
import os,sys
def CalcSha1(filepath):
with open (filepath, 'rb' ) as f:
sha1obj = hashlib.sha1()
sha1obj.update(f.read())
hash = sha1obj.hexdigest()
print ( hash )
return hash
def CalcMD5(filepath):
with open (filepath, 'rb' ) as f:
md5obj = hashlib.md5()
md5obj.update(f.read())
hash = md5obj.hexdigest()
print ( hash )
return hash
if __name__ = = "__main__" :
if len (sys.argv) = = 2 :
hashfile = sys.argv[ 1 ]
if not os.path.exists(hashfile):
hashfile = os.path.join(os.path.dirname(__file__),hashfile)
if not os.path.exists(hashfile):
print ( "cannot found file" )
else
CalcMD5(hashfile)
else :
CalcMD5(hashfile)
#raw_input("pause")
else :
print ( "no filename" )
|
使用Python进行文件Hash计算有两点必须要注意:
1、文件打开方式一定要是二进制方式,既打开文件时使用b模式,否则Hash计算是基于文本的那将得到错误的文件Hash(网上看到有人说遇到Python的Hash计算错误在大多是由于这个原因造成的)。
2、对于MD5
如果需要16位(bytes)的值那么调用对象的digest()
而hexdigest()
默认是32位(bytes),同理Sha1
的digest()
和hexdigest()
分别产生20位(bytes)和40位(bytes)的hash值
希望本文所述对大家Python程序设计有所帮助。