Staking的概念在今年日益火爆起来,各条PoS公链上运行的节点数量逐渐增多,节点所需的硬件门槛日益降低,但想要维护好一个节点在“软件”上却并不是一件容易事,如果版本更新不及时,没有足够的节点维护、防灾能力,不仅将造成节点收益降低、扣罚押金等问题出现,也会影响整条公链的安全性。
Cosmos升级故障,节点应对不及时
昨日,Cosmos计划于区块高度1933000进行的CosmosHub3升级遭遇故障。原本Cosmos的所有验证人计划于该区块高度开始,在一小时内完成节点升级,但由于升级故障,按照事先约定需要“降级到CosmosSDKv0.34.6并还原到其最新快照,然后再重新启动节点”,才可以保证节点依然正常运行。
Hub3升级提案:https://cosmos.bigdipper.live/proposals/16
区块高度1933000产生时间大概是北京时间昨日晚间19点半左右,部分节点可能对升级提案没有仔细阅读,对升级故障没有预料而因此应对不及时,导致昨晚一部分Cosmos节点不正常在线,大量漏块,不仅损失了应有的区块收益,根据Cosmos的slash规则,节点长期漏块将触发扣币惩罚,不仅节点的抵押金会被扣除,委托给它的委托人也将直接受到币的损失。
据Cosmos的区块浏览器mintscan.io显示数据与笔者的不完全统计,前100验证人中约有10%一度出现了在线率不正常的现象。例如,排名第19名的CryptiumLabs、排名第24名的Ztake.org、排名第28名的hashtower、排名第35名的HyperBlocksPro等节点一度有长达数小时的漏块现象,后来逐渐出块正常。
图片来自mintscan.io红框内表示区块出块的记录,空心区块表示漏块
至北京时间2019年9月24日24:00统计,排名第20名的BouBouNode、排名第53名的Wetez、排名第93名的CosmonantConsortium等节点依然大量漏块,uptime为0%。
图片来自mintscan.io红框内表示区块出块的记录,所有区块均漏块
至北京时间2019年9月25日8:00统计,排名第20名的BouBouNode、排名第53名的Wetez可能已完成降级与快照恢复,出块率恢复正常,通过回溯出块历史可发现,他们出现了长达5小时以上的漏块现象。而排名第19名的CryptiumLabs、排名第34名的Ping等节点又开始相继出现漏块现象,uptime变为0%。排名第93名的CosmonantConsortium节点一直没有恢复正常,连续漏块已达14小时。
损失收益无法弥补,可能继续触发惩罚
在Cosmos的规则下,如果节点连续9500个区块无法正常工作,则节点和其委托者都将受到Slash惩罚,不仅节点的抵押金将受到扣除,委托者的staking代币也将会受到对应比例的扣除。委托人与节点的利益被深度绑定,因此,部分节点的委托人必须加以警惕。
而即便在18小时连续漏块前完成了节点修复、恢复出块,漏块时间内的收益依然无法弥补,对委托人而言无疑也是非常大的损失。以BouBouNode节点为例,其昨晚两次长时间漏块总计约8小时,以总委托额为204万ATOM、年化10%的收益率计算,8小时损失的收益在185ATOM左右,8小时即损失500美金。
“在线迁移”一直是节点运维中非常关键的挑战之一,它指一个区块链系统在自己出块的情况下能够对原有的系统进行升级、扩容,且在迁移过程中不影响服务,这就类似于给飞行中的飞机换引擎,给马路上奔跑的汽车换轮胎,具有相当的技术挑战性。而未来,当区块链系统的上层应用越来越多时,在线升级的频率也会更加频繁。节点运营是个技术活,需要高质的技术实力与长期运维的耐心,否则,既会损害节点的收益,辜负委托人的信任,也会损害公链的安全性与生态发展。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。