语言中的密码学:从解密维吉尼亚到汉语和拉丁语的亲属关系
?作者:村头二旧
上一篇维吉尼亚加密法提出了一个非常关键的东西:钥匙。
对于加密和解密,钥匙都非常重要。这是上期出现的excel表格
钥匙就是BCH这三个不断循环的字母。
钥匙的出现敲响了近代密码学的前奏。
要给原文加密的时候,要选择某个字母用哪一套密码来加密,是由钥匙定的。比如上图中,出现了两次C,第一次C对应的钥匙是h,所以密文是J,而第二次对应的钥匙是b,那么密文就是D了。
刚开始出现维吉尼亚加密法的时候,钥匙是很短的,为什么呢?
好记好算呗。根据之前所讲的移位法和替换法,如果只有一个字母去加密,比如说就用bbb来做钥匙,结果就是所有的单字字母,往后面移位一个字母,a变成b,b变成c,这个就是简单到极端的维吉尼亚加密法,回到上一代的移位法了。
稍微难一点,是两个字母、三个字母、四个字母等等一个循环的字母序列或者单词,也就是维吉尼亚加密法的最初形态。
其实,逻辑上来说,如果是三个字母的钥匙不断的重复,总会出现碰巧密文是一样的情况。
And被加密成BPK。不是说维吉尼亚加密法每次字母都是不同的钥匙加密出来的都不一样吗?现在怎么一样了?这个时候你会推测出一个规律,如果原文中出现了重复的单词,这两个单词之间的距离也就是移位的距离差了正好是钥匙的长度,那么密文就会是一样的,推论一下,距离正好是密文长度的整数倍也是一样的。
比如,btcandethandeos这句话的加密中,改成btcandethbchandeos,这俩and肯定也是一样的密文。
这就是破解维吉尼亚加密法的密码:从密文中找规律,相同的连续字符找出来,然后分析钥匙的长度。
知道了钥匙长度会怎么样呢?
知道了钥匙的长度,比如说是3,那么第1个字母和第4个字母,第2个字母和第5个字母就是同一套加密了,如下图。
先不要借助什么设备,由于设置的比较简单,你会看到b变成了c,a变成了b,e变成了d,a变成了b……这下来,就是移了一位嘛,口算就可以。
所以,破解维基尼亚加密法就是先检索密文,找相同,推论出钥匙长度,然后,就成了移位法了,就可以用频率分析法破解了。
下面问题来了?
讲了几节课怎么感觉英文更容易发展出密码学,中文汉字似乎不太合适呢。
确实是这样的。
英文是26个字母顺序排列,这样的方法本身就可以非常顺畅的使用移位替换维基尼亚加密法等等,而汉字首先数量众多,单个字有数万个,常用字至少也有两千个,这样非常容易在古代卡死在隐藏法这种非常简陋的级别。
你说咱们汉字可是有汉语拼音呢?汉语拼音对应的字母不是也可以加密吗?
我为能有您这样智慧的读者感到荣幸,一下就看到了问题的核心本质。
来简单讲讲我们神奇的拼音史。我提出一个问题,中文和拉丁文有什么关系?
上过学的朋友跳出来说,“老师,您问错了吧,中文是甲骨文开始的象形文字,慢慢发展出来的,拉丁文是欧洲那边的,慢慢发展出英文、法文什么的,他俩有个毛关系”
恭喜,回答正确,但是我的问题没有问错,我告诉你答案,我现在电脑上打字,和拉丁文有莫大的关系,也就是说当代人说的汉语,键盘上打出来的字都和拉丁文有关系。
给你看一些符号。
知道这是什么吗?答案是:注音。
清朝末期、北洋政府搞出来的,至于古代汉语发声读音的规则,我在此不再细讲,可以看《说文解字》和王力先生的《古代汉语》。
这个注音呢不是很好,因为这些符号对我们来说仿佛是鬼画符一样不可理解,我们现在使用的拼音是怎么回事呢?
1955年的时候,中国文字改革委员会做了“汉语注音拉丁化方案”。从那时候开始做了一套东西,汉语拼音的拉丁转写标准。于是,拉丁文和汉语巧妙的结合了。
这个动作非常伟大,汉语本身是表音和表形,现在把表音的一部分拿出来搞出来就是一套新的拉丁文。
二三十年前,还有人用一套“四角号码查字法”,可以查字典,当时有三种查字法去使用字典,拼音、偏旁部首、四角号码。四角号码太麻烦,现在用的人很少了。主要是拼音,所以中国人学英文,至少老外学拼音是不太难的。
汉字拼音的拉丁化,就是汉字的国际化,汉字数字化,这个操作相当厉害,厉害到大家天天在用却没有发现,就像呼吸一样。“日用而不知”。
我以上所说,绝非夸张,朋友以前玩儿魔兽世界晚各类网络游戏,真的认识美国人和韩国人,不会打汉字,但是会用拼音和咱们交流。
??
来看看我从网上随意找到的聊天记录,这就是一个人认识一个老外,语音说了一句英文后打字“Pinyinkeyima”,然后就有了以上的对话,相信各位不用我来解说,也知道他俩聊的内容。
有个对话是这样的:“你不会汉字为什么会拼音?”外国友人说“拼音有英文字”。
拉丁化之后的汉字,相当于弯道超车,直接一步走到了加密法的领域,如果需要用什么加密法的话,也可以用拉丁文拼音直接去干起来。
之前说的移位替换维吉尼亚加密法,汉语全部打通。“我打通任督二脉”。汉语和拉丁语正式联姻。
投资策略和炒币可以沟通,写文章还是密码学。
我希望读者对整个密码学甚至语言学有更新的认知。语言,英语26个字母,汉语几万个单字,也可以对应到26个字母,所有的字母可以对应到机器语言的二进制0和1。再复杂的东西都可以简化,再简单的东西都可以集成,集成再高的东西都可以解密。这就是整个体系有趣的地方。
比如,今天过后,你就明白了一件事儿,汉语和拉丁文还有这么多联系,简单钥匙的维吉尼亚解密法是怎么解的。
其实,如果钥匙非常长呢,和原文一样长呢?频率分析再次失效了,怎么办,这些问题下一篇文章,再做解释,人类第一次世界大战中有更多的发展。
战争和商业不是我们讨论的重点,是我们讨论的底色。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。