python 提供了一个进行 hash 加密的模块:hashlib
hashlib 的官方介绍地址:http://docs.python.org/2/library/hashlib.html,当然是洋文的,下面理解来自于官网和自己的使用经验。
在应用中,常用的是 md5 加密和 sha1 加密(注意,是数字 1 不是字母 l,这类命名,应该最大限度避免。)
md5 的全称是 Message-Digest Algorithm 5(信息-摘要算法)。128 位长度。目前 md5 是一种不可逆算法。 具有很高的安全性。它对应任何字符串都可以加密成一段唯一的固定长度的代码。
sha1 的全称是 Secure Hash Algorithm 安全哈希算法 。SHA1 基于 MD5,加密后的数据长度更长, 它对长度小于 264 的输入,产生长度为 160bit 的散列值。比 md5 多 32 位。 因此比 MD5 更加安全,但 SHA1 的运算速度就比 MD5 要慢了。
Python 内置的 hashlib 模块就包括了 md5 和 sha1 算法。使用方法:
import hashlib
data = 'This a md5 test!'
hash_md5 = hashlib.md5(data)
hash_md5.hexdigest()
输出:
'0a2c0b988863f08471067903d8737962'
上面这段字符串就是 data 转换后的 MD5 值。
MD5 的用途:
与 MD5 类似:
import hashlib
hashlib.sha1('This is a sha1 test!').hexdigest()
上面说过可以用 MD5 来检测两个文件是否相同,但想想,如果是两个很大的文件,担心内存不够用,这时怎么办? 这就要使用 update 方法了。
import hashlib
def get_file_md5(f):
m = hashlib.md5()
while True:
data = f.read(10240)
if not data:
break
m.update(data)
return m.hexdigest()
with open(YOUR_FILE, 'r') as f:
file_md5 = get_file_md5(f)
(windows 用户 要使用 rb 方式打开文件)
可以用下面这段代码验证一下:
import hashlib
x = hashlib.md5()
x.update('hello, ')
x.update('python')
x.hexdigest()
hashlib.md5('hello, python').hexdigest()
这两次的输出是一样的。 SHA1 也是一样的用法。

