从自然数开始,一直讲明白了RSA非对称式加密的细节。前不久Jason同学邀请复旦大学数学系的梅同学给希望了解Web3的朋友们上了5节硬核的数学课。从自然数开始,一直讲明白了RSA非对称式加密的细节。我再回顾一下,尝试解释这个其实还挺复杂的事儿。
大数无法分解
3*7算出21容易吗?容易。反过来,21是哪两个数的乘积?也不难,但肯定比算3*7麻烦。
同理967*379=366493容易。反过来,366493是哪两个数乘积?难多了。
随着乘积的不断变大,算乘法的难度略微增大,算是这个数是由哪两个数相乘的难度陡峭的增加。
一个一百位数字的数和一百位数字的数相乘,手工算不容易,但对计算机来说不难,结果是一个大约两百位数字的数字。
反过来,把这个200位的数字分解?基本上现在能想到的办法就是近似于一个一个的试。别说算乘法了,光从一数到80位的数字,按照现在的计算水平,就要消耗掉一个中等恒星一生的能量了。所以,简单结论是,超级大的数字做分解不可能。
就利用这个简单的原理,加上听起来故弄玄虚的欧拉定理,就是一个精妙绝伦的RSA加密算法。
n进制取个位
这个东西的数学名称叫「取模」,就是算「一个数除以n以后的余数是几」。
不过我们不用这个名字。我自己发明的一个混杂了数学和计算机的概念,叫做?n进制取个位。比如n=8,八进制下只取个位,超过的十、百、千位数就直接扔掉,那么15这个数本来八进制就是17,只取个位,就是?7。所以,我们规定,15在八进制个位模式下,就等于7。同样,23,31等,在8进制取个位下,都等于7。这个「等于」,不是绝对数字的相等,而是经过了?n进制取个位,我们用?≡?表示这种特殊的等于。
这样,如果n是4万公里的话,数字的世界变成像地球一样,是一个循环。在赤道上可以向东走?1万公里,和向西走?3万公里结果是一样的,甚至向西走?7万,11万,15万公里的终点是一样的,就是一圈一圈的转就是了。所以4万进制取个位,1万?≡?-7万?≡-11万?≡-15万。注意,毕竟走7万公里和走11万公里不相等(=?),但是在地球赤道上走,他们的效果相等?(?≡?)。
例子:比如在?20?进制取个位下,3*7?的结果就是?1?。
连着乘两个数就是它本身
这有啥用呢?神奇的事情在于,在?20进制取个位下,任何数乘以3再乘以7,就相当于乘以?1,就是这个数本身!
比如?12*3?=36;36%20=?16;?16*7?=112;112%20=?12
变回原来了。神奇吗?
在?20进制取个位下,你把一个数乘以3,我不用除以3,而是继续乘以7,就是原来那个数。不仅仅是7,我把乘3的数字乘以67,127,或者187。。。。它都会回到原来那个数,只是转的圈数多了些。
这就使得,如果两个数在一个?n进制取个位下乘积为1,这两个数不就是一个很好的加密和解密的工具吗?
比如数字大一点,在366492进制取个位下,任何数乘以?967得到的数再乘以379,就是它本身。
公钥和密钥
如果我把?e=967?当做公钥,d=379?当做密钥,我只需要告诉别人这两个数字,别人乘积以后交给我,我再乘以d,然后。。。。
不过有一个小问题,如果给出了这两个数,别人除以e不就得到了我的秘钥d吗?毕竟,你可以算乘法,别人就可以算除法,而且难度差不多。我们把这个办法成为露馅儿加密法。
接下来要做的事情,就是想办法把这自己的密钥藏起来,让别人拿到n进制数,还有公钥e,没有办法算出我的密钥,但是依然可以用e加密,我可以用私钥d解密不就好了?
欧拉定理
我们引入?φ(n)。它的定义可厉害了,是「小于?n?的正整数中和?n?互质的数的个数」。这个定义忽略就好,只要知道,如果n是两个素数p,q的乘积的话,?φ(n)=(p-1)(q-1)。
欧拉发现了一个惊天大秘密,居然在?n进制取个位下,如果m和n互为质数,m的φ(n)次方居然等于1:
m^?φ(n)?≡?1
两边都取k次方:
m^?(k*?φ(n))?≡?1
两边都乘以m:
m^?(k*?φ(n)+1)?≡?m
k*?φ(n)+1?是啥意思?就是这是一个「除以??φ(n)余数为1」的数字。也就是说,只要找到e*d这两个数,使得他们的乘积除以?φ(n)?余数为1就好。这个好找,有一个叫做辗转相除法的方法,不过这里先略过。我们一般常常把e固定的设为65537,然后就可以找到一个满足的d。
最后,也就是最惊艳的一步,如果我们能够找到这样的e,d,我们把?e?和?n?告诉整个世界,让他们在?n进制取个位下,把要加密的数字?m?取?e?次方发给我,我对这个数再进行d次方,我就能得到m。
(m?^e)^?d?≡?m
重新梳理
到现在大家应该已经无一例外的晕厥了。这很正常。我们再理一下就清楚了。
就是说,如果我能无论用什么方法,找到一个进制n,在这个?n进制取个位下,能够找到两个数字e和d,e公开给整个世界,d留给自己,同时还能让任何数字m的e次方的d次方还等于原来这个m,加密解密算法不就成立了吗?就跟最早我说的那个乘以一个数,再乘以另一个数,总等于原来的数字一样?
但露馅儿加密法两个乘法的算法的明显的漏洞在于,e和n给出了,d也就给出了。
在这个新的算法中,e给出了。n给出了,但e*d??≡?1的进制,不是简单地?n,而是和n同源,但是不同的?φ(n)?。正因为进制改了,所以也不能用露馅儿加密法里面的两次乘法,而借用欧拉的惊天发现,做了两次幂运算。
从?n?能不能算出来??φ(n)?呢?如果有能力分解n当然?φ(n)?唾手可得,把两个因子各自减一再乘起来就好。
但是从n能不能轻易地找到p和q呢?根据最早的大数不可分解,要想找到100个太阳烧掉都不够用,p和q好像是脚手架,算出来n,算出来?φ(n)就扔掉了。?那么??φ(n)?就是一个秘密。如果?φ(n)?是个秘密,有了e也找不到d。
所以,整个算法是无比精巧的安全。
举例子
我们找两个脚手架数字:p=2,q=7,算出n=2*7=?14,??φ(n)?=?(2-1)*(7-1)=?6?。那两个脚手架数字p,q在算出n和?φ(n)后就退休了。找在?6进制取个位下,e*d?≡?1好办,e=5,d=11就行。
这样,公布给全世界的数字就是(e=5,n=14),保留给自己的就是d=11。φ(n)千万也不能告诉任何人。φ(n)?就如同总统,n如同他的影子。世界只能看到他的影子,看不到总统本人。好在影子在世间行走不怕暗杀,总统躲在防空洞里是安全的。
我们来试一下,在?14?进制个位模式下,如果要传递的数字?m=?2,别人把m^e算出来,就是2^?5=?32?=2*?14?+4?≡?4
现在,4就可以大大咧咧的在互联网上随便传输了。只有我知道有一个秘密是11。我拿到以后,算4的11次方,4^11?≡?4,194,304%14?≡?2?,不就是别人要给我的那个数字吗?前提是,我们认为别人从n=14无法分解成2*7,否则就全露馅了。
14肉眼可以看出等于2*7。
这个数n:
8244510028552846134424811607219563842568185165403993284663167926323062664016599954791570992777758342053528270976182274842613932440401371500161580348160559?
是p
91119631364788082429447973540947485602743197897334544190979096251936625222447
乘以q
90480063462359689383464046547151387793654963394705182576062449707683914045697
计算机眼也看不出来。?p和q如同两位门神,死死的守住了获取它们后面的秘密的入口。但是从p,q算出?φ(n)?,以及e,d,却都是举手之劳。
如果知道n的组成是p,q,我们按照上面的算法可以选出来e和d:
65537
2545549238258797954286678713888152865623498585866759298032549597771444725977268190722532488574321463855938811396613702406984581214587037347197409962813953
也就是说,这个游戏,任何人要把一个数字m传给我,只需要在n进制取个位下,对它进行65537次幂,我再把它进行d次幂,我就拿回了原来的数字。
这个精巧的算法,就是RSA加密算法。
希望有人能够看明白。我真的是尽力了。
原文标题:《用吃奶的劲试着解释加密算法的数学原理》
撰文:王建硕
来源:ForesightNews
来源:金色财经
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。