锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

【图解SHA1杂凑算法】SHA1杂凑算法的Python实现保姆级教程 | 物联网安全 | 信息安全

时间:2022-11-03 21:00:00 mn35光电传感器对射型

在这里插入图片描述
系列索引:图解安全加密算法加密算法系列索引 Python实现保姆级教程 | 物联网安全 | 信息安全

实验开始时发现的代码大多是基于c/c ,python可参考的资料很少,所以借着这次实验的机会把自己走过坑分享一下,希望对大家有所帮助!

文章目录

    • 一、什么是SHA1
    • 二、SHA哈希算法流程
    • 三、具体实现过程(附代码)
      • (1)信息填充
      • (2)分割已填充消息
      • (3)设置初始散列值
      • (4)16份子明文分组扩展到80份
      • (5)SHA1的4轮运算
    • 四、跟着demo去debug
    • 五、完整代码

一、什么是SHA1

SHA-1是一种数据加密算法,该算法的思维是接纳一段明文,然后以不可逆转的方式将其转换为一段(通常较小)密文,也可以简单地理解为取一串输入代码(称为预映射或信息),并将其转换为短、固定位数的输出序列散列值(也称为摘要信息或信息认证代码)过程

二、SHA哈希算法流程

对于任何长度的明文,SHA首先对其进行分组,使每组长度为512位,然后重复处理这些明文分组。
摘要生成过程如下:

(1) 将512位的明文分组划分16个子明文分组,每个子明文分组32个。
(2) 申请5个32位的链接变量,记为A、B、C、D、E。
(3) 16份子明文分组扩展为80份。
(4) 80个子明文分组4轮运算
(5) 链接变量和初始链接变量求和运算
(6) 链接变量作为下一个明文分组的输入重复以上操作。
(7) 最后,五个链接变量中的数据是SHA1摘要。

三、具体实现过程(附代码)

在进行散列值计算之前,先要对需要加密的数据进行预处理。这一预处理由三部分组成:填充消息,分割填充消息(将填充消息等分成m位处理块),为散列值计算设置初始化值。

(1)信息填充

假设原始消息(M)长度为L位。在消息的最后加一个1,然后在这个1后面加一个0,使得L 1 k(即补位后的消息长度)满足对512取模后余数是448。然后,添加最后的64位二进制数据,这64位二进制数据就是原始L位消息(M)二进制的长度表示。

flag = 1  # 补1标志位,补1后0 while len(M) % 512 != 448: #M二进制串(字符串类型)未补位     if flag:         M  = '1'         flag = 0     else:         M  = '0' M  = "{:064b}".format(l)  # 最后64位写入长度,空余补位0 M = hex(int(M, 2))[2:]  # 这种转换将多次使用,2进制转16进制,M现在是16进制字符串,如‘1342a2c12...'  

补位后如下:

(2)分割已填充消息

新闻填充后,还必须将数据分成m位一组N块的数据块,以提供以下散列值计算过程。对于SHA-1加密算法,填充的信息分为N(M(1),M(2),…,M(N))块,每块512位。(其长度仅为512位的整数倍,然后按512位的长度分组(block))然后每组512位的输入块可以表示为16个32位,分别记录为:M0(i),M1(i),…,M15(i)。

Mn = []  # 由于M中一个字符4位(16进制)存储每个32位字, #所以把M中的8个分成一组,按要求把M分成16个32个字,所以这里的8个*4=32,32*16=512 for i in range(16):
    Mn.append(M[8*i: 8*i+8])

(3)设置初始散列值

初始散列值由下面5个32位的字组成,其16进制表示如下:
A=0x67452301,B=0xEFCDAB89,C=0x98BADCFE,D=0x10325476,E=0xC3D2E1F0。

(4)16份子明文分组扩展为80份

将这16份子明文分组扩充到80份子明文分组,我们记为W[k](k= 0, 1,……79),扩充的方法如下。
Wt = Mt , 当0≤t≤15
Wt = (Wt-3⊕Wt-8⊕ Wt-14⊕Wt-16) <<< 1, 当16≤t≤79

W = ['' for _ in range(80)]  # 存储80份扩展子明文
for i in range(80):
    if 16 <= i <= 79:
        # 16-79要进行异或运算,这里先转换成十进制(W中存的是16进制字符串,str无法运算)
        temp = int(W[i-3], 16) ^ int(W[i-8],
                                     16) ^ int(W[i-14], 16) ^ int(W[i-16], 16)

        W[i] = hex(roll_left(temp, 1))[2:].zfill(8)  # 循环左移1位
    else:
        W[i] = Mn[i]

(5)SHA1的4轮运算

SHA1有4轮运算,每一轮包括20个步骤,一共80步(对应扩展后的80个W[t]),当第1轮运算中的第1步骤开始处理时,A、B、C、D、E五个链接变量中的值先赋值到另外5个记录单元A′,B′,C′,D′,E′中。这5个值将保留,用于在第4轮的最后一个步骤完成之后与链接变量A,B,C,D,E进行求和操作。

SHA1的4轮运算,共80个步骤使用同一个操作程序,如下:

A,B,C,D,E←[(A<<<5)+ ft(B,C,D)+E+Wt+Kt],A,(B<<<30),C,D

其中 ft(B,C,D)为逻辑函数,Wt为子明文分组W[t],Kt为固定常数。
这个操作程序的意义为:
● 将[(A<<<5)+ ft(B,C,D)+E+Wt+Kt]的结果赋值给链接变量A;
● 将链接变量A初始值赋值给链接变量B;
● 将链接变量B初始值循环左移30位赋值给链接变量C;
● 将链接变量C初始值赋值给链接变量D;
● 将链接变量D初始值赋值给链接变量E。

Ap, Bp, Cp, Dp, Ep = A, B, C, D, E  # 暂存初始值
for t in range(80):
    tmp = B
    B = A
    A = ((((E + ft(tmp, C, D, t)) % (2**32)+roll_left(A, 5)) %
         (2**32)+int(W[t], 16)) % (2**32)+K[t//20]) % (2**32)  # 预防溢出进行取模运算
    E = D
    D = C
    C = roll_left(tmp, 30)

SHA1规定4轮运算的逻辑函数如表

def ft(b, c, d, t):
    """ft为逻辑函数 Parameters ---------- b : int B值 c : int C值 d : int D值 t : int 轮次 Returns ------- int 运算结果 """
    if t >= 0 and t <= 19:
        return ((b & c) | (~b & d))
    elif t >= 20 and t <= 39:
        return (b ^ c ^ d)
    elif t >= 40 and t <= 59:
        return ((b & c) | (b & d) | (d & c))
    elif t >= 60 and t <= 79:
        return (b ^ c ^ d)


SHA1的常数K取值表

四、跟着demo去debug

这里使用’abc’进行测试,包括各个步骤的结果,供大家debug使用








这里将最后一轮(79轮)的结果与初始值相加。

五、完整代码

代码已补充,不足之处大佬见谅,还有很对待完善之处,欢迎大家批评指正!

import random

A, B, C, D, E = 0x67452301, 0xEFCDAB89, 0x98BADCFE, 0x10325476, 0xC3D2E1F0  # 常量
K = [0x5A827999, 0x6ED9EBA1, 0x8F1BBCDC, 0xCA62C1D6]  # 常量

str = input("输入明文:\n").encode('utf-8')  # 这里对输入明文进行编码,str为bytes型
l = len(str)*8  # 每个字符8位
# python中二进制是字符串,不保留高位的0,这里使用zfill补高位0,如十进制6->110->0110,M这里是用了一个很长的字符串如:'11001010100011...'来表示原始数据
M = bin(int(str.hex(), 16))[2:].zfill(l)

# [可选项] 下面的函数仅仅显示输入明文的ascii,末尾为长度,该段显示的是补位后的
for i in range(64):
    if i < len(str):
        print(str[i], end=' ')
    elif i < len(str)+1:
        print('128', end=' ')
    elif i < 63:
        print('0', end=' ')
    else:
        print(l)

flag = 1  # 补1标志位,补一次1后置0
while len(M) % 512 != 448:
    if flag:
        M += '1'
        flag = 0
    else:
        M += '0'
M += "{:064b}".format(l)  # 末尾64位写入长度,空余补位补0
M = hex(int(M, 2))[2:]  # 这种转换会用到很多次,2进制转16进制,M现在是一个16进制字符串,如'1342a2c12...'
Mn = []  # 存储每个32位的字,因为M中一个字符4位(16进制),所以取M中的8个为一组,按要求将M分割成16个32位的字,故这里8*4=32,32*16=512
for i in range(16):
    Mn.append(M[8*i: 8*i+8])


def roll_left(num, k):
    """循环左移函数 Parameters ---------- num : int 输入一个数字,2进制、10进制等均可 k : int 左移位数 Returns ------- int 返回一个int结果 """
    num_bin = bin(num)[2:].zfill(
        32)  # 因为python高位不会自动补0,导致要手动调整(也可能是我学艺不精),不然会忽略高位的0循环左移
    out = num_bin[k % len(num_bin):]+num_bin[:k % len(num_bin)]  # 注意预防溢出
    return int(out, 2)  # 二进制左移完成后转化成10进制输出


W = ['' for _ in range(80)]  # 存储80份扩展子明文
for i in range(80):
    if 16 <= i <= 79:
        # 16-79要进行异或运算,这里先转换成十进制(W中存的是16进制字符串,str无法运算)
        temp = int(W[i-3], 16) ^ int(W[i-8],
                                     16) ^ int(W[i-14], 16) ^ int(W[i-16], 16)

        W[i] = hex(roll_left(temp, 1))[2:].zfill(8)  # 循环左移1位
    else:
        W[i] = Mn[i]


def ft(b, c, d, t):
    """ft为逻辑函数 Parameters ---------- b : int B值 c : int C值 d : int D值 t : int 轮次 Returns ------- int 运算结果 """
    if t >= 0 and t <= 19:
        return ((b & c) | (~b & d))
    elif t >= 20 and t <= 39:
        return (b ^ c ^ d)
    elif t >= 40 and t <= 59:
        return ((b & c) | (b & d) | (d & c))
    elif t >= 60 and t <= 79:
        return (b ^ c ^ d)


Ap, Bp, Cp, Dp, Ep = A, B, C, D, E  # 暂存初始值
for t in range(80):
    tmp = B
    B = A
    A = ((((E + ft(tmp, C, D, t)) % (2**32)+roll_left(A, 5)) %
         (2**32)+int(W[t], 16)) % (2**32)+K[t//20]) % (2**32)  # 预防溢出进行取模运算
    E = D
    D = C
    C = roll_left(tmp, 30)

    #print(f" round{t+1} : {hex(A)} {hex(B)} {hex(C)} {hex(D)} {hex(E)}\n")
A, B, C, D, E = (Ap+A) % (2**32), (Bp+B) % (2**32), (Cp +
                                                     C) % (2**32), (Dp+D) % (2**32), (Ep+E) % (2**32)
# 相加运算,因为python不像c/c++可以使用unsigned char_32直接限制位数,因此要对位数进行限制
print("明文对应的杂凑码:\n", hex(A), hex(B), hex(C), hex(D), hex(E))

图解安全加密算法系列持续更新,欢迎点赞收藏关注

上一篇:【图解DSA数字签名算法】DSA签名算法的Python实现 | 物联网安全 | 信息安全
下一篇:【图解RSA加密算法】RSA非对称密码算法的Python实现保姆级教程 | 物联网安全 | 信息安全

本人水平有限,文章中不足之处欢迎下方👇评论区批评指正~

如果感觉对你有帮助,点个赞👍 支持一下吧 ~

不定期分享 有趣、有料、有营养内容,欢迎 订阅关注 🤝 我的博客 ,期待在这与你相遇 ~

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章