POW:金色观察 | 以太坊ProgPoW升级再度无望?一文读懂ProgPoW_BNBFROG

原本计划要在伊斯坦布尔硬分叉中实施的ProgPow终于又有消息了,但是什么时候升级仍然悬而未决。

据CryptoBriefing报道,以太坊核心开发者正在推进ProgPoW,暂定在7月进行硬分叉升级。自从矿机制造商比特大路和芯动科技分别于2018年4月和7月发布专用集成电路(ASIC)的以太坊ASIC矿机E3和A10以来,为避免专业ASIC矿机制造商垄断以太坊算力,保护以太坊网络的去中心化和网络安全,以太坊社区在过去两年中一直在讨论将以太坊算法转换为ProgPoW的问题。新算法可以使以太坊挖矿具有抗ASIC性。

但是,最新消息是,硬分叉协调员James Hancock谈到ProgPoW是否应该跟 EIP-1962放到同一次分叉中,但是以太坊社区核心人员如Spankchain的Ameen Soleimani、Gnosis的MartinK?ppelmann、Uniswap的Hayden Adams、ConsenSys的Igor Lilic以及众多以太坊开发人员表示反对ProgPoW。也就是说,以太坊核心开发者并未就ProgPoW达成一致意见,也没有暂定硬分叉的时间。

人权基金会将向多名贡献者提供 21 万美元的比特币开发补助金:非营利组织人权基金会(HRF)将向多名贡献者提供21万美元的比特币开发补助金,其中比特币核心贡献者CalvinKim、DhruvMehta和AbubakarNurKahlil将各获得5万美元,Breez和Sphinx闪电网络钱包团队各获得2.5万美元,将比特币文档翻译为阿拉伯语的Arabic_HODL将获得1万美元。其中CalvinKim将使用该资金研发Utreexo比特币全节点、DhruvMehta将继续通过BIP-324加强比特币网络安全、AbubakarNurKahlil将为其祖国尼日利亚研发一款比特币钱包以应对国内腐败与资本管制。此外,Breez和Sphinx将使用该资金继续进行比特币闪电网络拓展的开发。[2021/6/1 23:02:01]

那么ProgPoW到底是个啥?ProgPoW何以能缩小GPU挖矿与ASIC之间的差距?

ProgPoW主要是根据GPU的特性对以太坊的Ethash算法做了修改,缩小GPU与专用ASIC之间的算力差距。

NYDIG首席执行官:对机构资金流入比特币非常有信心:纽约数字投资集团(NYDIG)首席执行官Ross Stevens在MicroStrategy的比特币教育会议上称,对机构资金流入比特币非常有信心。他表示,“我相信,未来10年CEO们做出的最重要决定是关于如何分配比特币。我的同伴们在2020年购买的比特币比在2013年至2019年的总和还多,我预计我们将在未来两年购买更多比特币。”(Coingape)[2021/2/7 19:09:42]

一句话解释,用ProgPoW开发团队IfDefElse的话是:“PoW挖矿,通常是设计硬件让算法更高效。但ProgPoW相反,先有硬件,然后再修改算法来匹配它。”

Ethash算法

PoW是一个概念统称,有很多种算法实现。目前以太坊使用的具体PoW算法是Ethash,它是Dagger—Hashimoto算法的变种。

Hashimoto算法采用IO饱和策略来对抗ASIC,使内存读取成为PoW挖矿过程中的限制因素。Dagger算法使用DAG(directed acyclic graphs—有向无环图)来同时实现内存难解和内存易验证两个特点。主要原理是挖矿过程需要存储完整的DAG数据,同时在计算每个nonce时需要抽取DAG中的部分数据。

选取这个算法的结果使得,挖矿计算性能的瓶颈在于内存大小和内存带宽,而和哈希计算能力关系不大。比如NVIDIA GTX1070执行Ethash时,内存在达到88.3%的利用时,作为显卡计算核心的SM(streaming multiprocessor)只有27.7%的利用率。

同时使得通过大规模部署共享内存的ASIC矿机并不能带来在挖矿效率上同比例线性增长。

Ethash算法的一般流程如下:

1、首先根据块信息计算一个种子;

2、使用这个种子,计算出一个16MB的cache数据。

3、通过cache,计算出一个1GB(初始大小)的数据集(DAG),DAG可以理解为是一个完整的搜索空间,全客户端和矿工需要存储完整的DAG,

4、挖矿:需要从DAG中重复随机抽取64次数据拿去和其他数据计算mixhash(如下图)

在早期Ethereum和Solidity智能合约代码中,Keccak和SHA3是同义词。在2015年8月NIST标准化SHA3后,标准的SHA3和Keccak算法有所区别。为了避免和NIST标准的SHA3混淆,现在的代码直接使用Keccak作为函数名。

每次Ethash从DAG中随机取64128 bit=8192 Bytes数据。以GTX 1070显卡为例,带宽为256GB/s,那么每秒能承受256*1024*1024*1024/8192=33554432次Ethash运算,即33MH/s算力。

针对Ethash的专用ASIC

可以根据需要执行的命令量身定制专用硬件来解决,比如在Ethash开始和结束时调用的哈希函数Keccak在ASIC上可以更有效执行。

针对Ethash,专用ASIC大致可以采用三个专用功能来提高计算性能:

一个从DAG导入数据的高带宽内存接口(一般来说是GDDR6或者HBM2)

一个用于Keccak哈希计算的keccak引擎;

一个用于执行内部循环FNV和地址模运算的小型计算核心;

由此专门定制的ASIC将比现有GPU体积更小且能耗更低。高配置(GDDR6或者HBM2)的以太坊ASIC矿机可以达到GPU矿机挖矿性能的2倍。

事实上,大矿机商都曾推出过以太坊ASIC矿机。2018年4月比特大陆推出以太坊ASIC矿机E3,芯动科技2018年7月发布以太坊ASIC矿机A10。但因为以太坊社区抵制,威胁可能会修改算法,同时还有部分技术原因,比如比特大陆的E3因为采用的是DDR3内存,ASIC矿机相比GPU并没有多少算力优势。因此,以太坊ASIC矿机并没有得到大规模采用。

ProgPoW做了哪些改变

ProgPoW,是Programmatic Proof-of-Work的缩写。正如IfDefElse所说,为匹配现行主流GPU的硬件特征,ProgPoW算法主要做了如下改进:

1、把keccak_f1600(64字节的字)改成keccak_f800(32字节的字)。32字节是目前主流GPU一次操作处理的实际位数。

2、在主循环环节增加了数学随机序列。目前GPU计算核心内有着大量暂存器,可为高吞吐量可编程数学单元提供信号。Ethash的内部循环先是DAG载入,然后用FNV将数据合并为小的混合状态。ProgPoW添加了一系列随机数学指令和随机缓存读取,进而合并为更大的混合状态。

3、DAG数据读取大小从128 byte增加到256 byte。当前主流GPU DRAM均为32位(32*8=256 byte),这样ProgPoW可以在当前DRAM设备上更有效率地执行;

4、GPU具有少量高速暂存器内存,允许快速处理访问随机地址,ProgPoW也利用了GPU这一特性。

其中迭代运算次数即访问DAG次数保持不变,与Ethash一样仍是64次。

经过优化后,ProgPoW能大幅提高GPU计算能力。Nvidia GTX1070运行ProgPoW测试结果表明,在内存利用率达到87.55%时,GPU计算核心的SM(streaming multiprocessor)利用率能达到87.95%。

ProgPoW大幅缩小了ASIC和GPU间的性能差距

理论上,还是可以制造出专门用于执行ProgPoW的ASIC的。但这种ASIC不仅需要高带宽内存接口和小型Keccak+KISS99引擎;还需要具有大型寄存器、大量随机数学能力的计算核心;高吞吐量、低延迟、大存储的缓存。

造成的实际后果是这种专用ASIC会和与现有GPU的性能非常相似。经过优化后的ASIC计算性能将只有目前GPU的1.1-1.2倍,大幅缩小ASIC和GPU之间的性能差距。

考虑到研发ASIC的巨额成本以及以太坊社区的抵制,研发以太坊ASIC极低的性价比也会让矿机商主动远离以太坊。

事实上,要不要抵制ASIC本身也存在争议。因为在有些人眼里,GPU也是某种形式的ASIC。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

大币网

[0:32ms0-11:109ms