python 提供了一个进行 hash 加密的模块:hashlib
hashlib 的官方介绍地址:http://docs.python.org/2/library/hashlib.html,当然是洋文的,下面理解来自于官网和自己的使用经验。
在应用中,常用的是 md5 加密和 sha1 加密(注意,是数字 1 不是字母 l,这类命名,应该最大限度避免。)
md5 的全称是 Message-Digest Algorithm 5(信息-摘要算法)。128 位长度。目前 md5 是一种不可逆算法。 具有很高的安全性。它对应任何字符串都可以加密成一段唯一的固定长度的代码。
sha1 的全称是 Secure Hash Algorithm 安全哈希算法 。SHA1 基于 MD5,加密后的数据长度更长, 它对长度小于 264 的输入,产生长度为 160bit 的散列值。比 md5 多 32 位。 因此比 MD5 更加安全,但 SHA1 的运算速度就比 MD5 要慢了。
Python 内置的 hashlib 模块就包括了 md5 和 sha1 算法。使用方法:
- import hashlib
-
- data = 'This a md5 test!'
-
- hash_md5 = hashlib.md5(data)
-
- hash_md5.hexdigest()
-
输出:
- '0a2c0b988863f08471067903d8737962'
-
上面这段字符串就是 data 转换后的 MD5 值。
MD5 的用途:
与 MD5 类似:
- import hashlib
- hashlib.sha1('This is a sha1 test!').hexdigest()
-
上面说过可以用 MD5 来检测两个文件是否相同,但想想,如果是两个很大的文件,担心内存不够用,这时怎么办? 这就要使用 update 方法了。
- import hashlib
- def get_file_md5(f):
- m = hashlib.md5()
- while True:
- data = f.read(10240)
- if not data:
- break
- m.update(data)
- return m.hexdigest()
-
- with open(YOUR_FILE, 'r') as f:
- file_md5 = get_file_md5(f)
-
(windows 用户 要使用 rb 方式打开文件)
可以用下面这段代码验证一下:
- import hashlib
-
- x = hashlib.md5()
- x.update('hello, ')
- x.update('python')
- x.hexdigest()
-
- hashlib.md5('hello, python').hexdigest()
-
这两次的输出是一样的。 SHA1 也是一样的用法。