点击阅读:EVM深入探讨Part1
导语
在第1部分中,我们探讨了EVM如何通过被调用的合约函数知道需要运行哪个字节码,其中我们了解了调用栈、calldata、函数签名和EVM操作码指令。
在第2部分中,我们将开启内存之旅,全面了解合约的内存以及它在EVM上的工作方式。
此系列我们将引介翻译noxx的文章深入探讨EVM的基础知识。
内存之旅
我们依然使用第1部分中在remix上为大家演示的示例代码。
第1部分中我们根据合约编译后生成的字节码研究了与功能选择相关的部分。在本文中,我们将注意力放在字节码的前5个字节。
这5个字节表示初始化“空闲内存指针”操作。要完全理解这些字节码的作用,首先需要理解管理支配合约内存的数据结构。
1、内存数据结构
合约内存是一个简单的字节数组,其中数据存储可以使用32字节或1字节的数据块存储数据,但是读取时每次只能读取固定大小的32字节的数据块。下面的图片说明了此结构以及合约内存的读/写功能。
这个功能是由操作内存的3个操作码决定的。
MSTORE(x,y):从内存位置“x”开始存储一个32字节的“y”?值。
MLOAD(x):从内存位置“x”开始将32字节加载到调用栈上。
链游Abyss World将基于Polygon zk-EVM构建游戏:6月28日消息,链游Abyss World发推称,将基于Polygon zk-EVM来构建游戏,这将使Abyss World中的智能合约执行更高效,并能够处理更多的用户交互。
Abyss World称,希望双方合作能够释放出Web3游戏创造力的全部潜力。[2023/6/28 22:06:23]
MSTORE8(x,y):在内存位置“x”存储一个1字节的值“y”。
你可以将内存位置简单地看作是开始写入/读取数据的数组索引。如果想写入/读取超过1个字节的数据,只需继续从下一个数组索引写入或读取。
2、EVMPlayground
EVMPlayground有助于巩固我们这3个操作码的运行原理、作用以及内存位置的理解。单击Run和右上角的箭头进行调试来查看堆栈和内存是如何更改的。
可能会注意到一些奇怪的现象,我只添加了1个字节,为什么多了这么多零呢?
3、内存扩展
当合约写入内存时,需要为写入的字节数支付Gas,也就是扩大内存的开销。如果我们正在写入一个以前没有写入过的内存区域,那么第一次使用它会产生额外的内存扩展开销。
写入之前未触及的内存空间时,内存以32字节为增量扩展。前724个字节,内存扩展呈线性增长,之后呈二次方增长。(由以太坊黄皮书公式326扩大内存的Gas开销得出,公式为:
Polygon zkEVM主网Beta版将于6月8日更新:6月7日消息,Polygon 宣布其 zkEVM 主网 Beta 版将于北京时间 6 月 8 日 18:00 进行更新,更新需要重启 Sequencer,这可能会导致用户在提交交易时遇到问题。[2023/6/7 21:21:07]
,扩展内存时为每个额外的字的开销。其中a是合约调用中写入的最大内存位置,以32字节字为单位。用1024字节内存为例,那么a=32。)
在位置32处写入1个字节之前,我们的内存是32个字节。此时我们开始往未触及的内存空间写入内容,结果,内存增加了32个字节,增加到64个字节。内存中所有位置的都初始被定义为0,这也是为什么我们会看到?2200000000000000000000000000000000000000000000000000000000000000?被添加到内存中的原因。
4、内存是一个字节数组
调试过程中,我们可能注意到的第二件事发生在我们从内存位置33(0x21)运行MLOAD时。我们将以下值返回到调用栈。
3300000000000000000000000000000000000000000000000000000000000000
内存读取可以从一个非32字节元素开始。
内存是一个字节数组,这意味着可以从任何内存位置开始读取。我们不限于32的倍数。内存是线性的,可以在字节级别进行寻址。内存只能在函数中新建。它可以是新实例化的复杂类型,如数组/结构或从存储引用的变量中复制。
现在我们对数据结构已有了一定的了解了,接下来让我们来看空闲内存指针。
5、空闲内存指针
空闲内存指针只是一个指向空闲内存开始位置的指针。它确保智能合约可以跟踪到哪些内存位置已写入,哪些未写入。这可以防止合约覆盖已分配给另一个变量的某些内存。当一个变量被写入内存时,合约将首先引用空闲内存指针来确定数据应该存储在哪里。然后,它通过记录要写入新位置的数据量来更新空闲内存指针。这两个值的简单相加将产生新的空闲内存开始的位置。
ConsenSys zkEVM项目Linea推出忠诚度活动以鼓励早期用户使用:5月2日消息,据官方消息,ConsenSys 旗下 zkEVM 项目 Linea 联合 Galxe 推出忠诚度活动以鼓励早期用户使用网络。[2023/5/3 14:39:19]
空闲内存指针的位置+数据的字节大小=新空闲内存指针的位置
6、字节码
就像我们之前所提到的,空闲内存指针是通过这5个操作码在运行时字节码的定义的。
这些操作码声明空闲内存指针位于内存中字节0x40处,值为0x80。
Solidity的内存布局保留了4个32字节的插槽:
0x00-0x3f(64bytes):暂存空间,可用于语句之间,即内联汇编和哈希散列方法。
0x40-0x5f(32bytes):空闲内存指针,当前分配的内存大小,空闲内存的起始位置,初始化为0x80。
0x60-0x7f(32bytes):插槽0,用作动态内存数组的初始值,永远不应写入。
我们可以看到,0x40是空闲内存指针的预定义位置。而值0x80只是在4个32字节保留值插槽之后可写入的第一个内存字节。
7、合约中的内存
为了巩固我们到目前为止所学到的知识,接下来将看看内存和空闲内存指针是如何在Solidity代码中更新的。
我们创建MemoryLane合约来进行演示。合约的?memoryLane()?定义了两个长度分别为5和2的数组,并将uint256类型的1赋值给?b。
Polygon zkEVM主网测试版即将上线:金色财经报道,Polygon 将于周一向公众发布 zkEVM 测试版,Polygon 表示,它正在将其 zkEVM 的所有方面都开源,因此开发人员能够研究和共享代码,从而使他们能够为零知识领域的更多创新做出贡献。
此外,以太坊区块链的联合创始人 V神 将在新的 zkEVM 上启动第一笔交易,并将于东部时间上午 10:30 在 ETHGlobal 进行直播。据 Polygon 新闻稿,目前超过 50 家公司表示他们将使用 Polygon zkEVM 技术进行构建。[2023/3/27 13:29:25]
要查看合约代码在EVM中执行的详细信息可以将其复制到RemixIDE中编译并部署合约。调用??memoryLane()?后进入DeBug模式来逐步执行操作码(以上操作可以参考:
https://remix-ide.readthedocs.io/en/latest/tutorial_debug.html)。
将简化版操作码提取到EVMPlayground中,可通过这个链接查看具体的操作码及注释信息。
这里将操作码分成6个不同的部分依次解读,删除了JUMP以及与内存操作无关的操作码同时将注释添加了进去方便查看当前在执行什么操作。
1)空闲内存指针初始化
首先,0x80先入栈,这是由Solidity内存布局规定的值,当前内存中没有任何东西。
最后,我们调用MSTORE,它将第一项从栈0x40弹出以确定在内存中写入的位置,并将第二个值0x80作为写入的内容。这样留下了一个空栈,但已经填充了一部分到内存中。内存由十六进制字符表示,其中每个字符代表4位。例如:在内存中有192个十六进制字符,这意味着我们有96个字节。如果我们回顾Solidity的内存布局会发现,前64个字节将被分配为暂存空间,接下来的32个字节将用于空闲内存指针。
Ripple兼容EVM侧链XRP Ledger提出跨链桥以提高网络和Token利用率:金色财经报道,Ripple 兼容 EVM 侧链 XRP Ledger(XRPL)与 Ripple 开发实验室 RippleX 的开发人员为跨链桥提出了一个新的 XRPL 标准,该标准将实现不同网络之间的互操作性。据悉,XRPL 标准为开发人员在 XRP Ledger 上构建应用程序提供了规范和指南,确保了网络间的兼容性和通信,拟议的标准将允许来自一个区块链的 Token 锁定在 XRP 分类账上的智能合约中,而在另一个区块上发行等量的 Token。[2023/2/23 12:25:27]
2)内存分配变量“a”和空闲内存指针更新
接下来的部分,我们将跳到每个部分的结束状态,并简洁概述。
首先,为变量“a”分配下一个内存,并更新空闲内存指针。编译器将通过数组大小和默认数组元素大小确定需要多少空间。Solidity中内存数组中的元素都是占据32字节的倍数。当前需要分配的内存为5*32字节,表示为160或0xa0。我们可以看到它被压入栈中并添加到当前空闲内存指针0x80来获取新的空闲内存指针值。这将返回0x120,我们可以看到它已被写入空闲内存指针位置。调用栈将变量“a”的内存位置保存在栈0x80上,以便以后可以在需要时引用它。0xffff代表一个JUMP位置,可以忽略,因为它与内存操作无关。
3)内存初始化变量“a”
已经分配好了内存并且更新了空闲内存指针,接下来需要为变量“a”初始化内存空间。由于该变量只是被声明并没有被赋值,它将被初始化为零值。
EVM通过使用了?CALLDATACOPY操作码来进行操作,其中存在3个变量。
memoryOffset/destOffset?
calldataOffset/offset
size/length
表达式:
memory=msg.data
在这个例子中,memoryOffset(destOffset)?是变量“a”的内存位置。calldataOffset(offset)?是实际calldata的大小,因为并不需要复制任何calldata,所以初始化内存为零。最后,传入的变量为0xa0。
这是可以看到我们的内存已经扩展到288字节,并且调用栈再次保存了变量的内存位置和以及栈上的JUMP地址。
这与变量“a”的内存分配和空闲内存指针更新相同,只是这次是针对“bytes32memoryb”。内存指针更新为0x160,等于先前的空闲内存指针288加上新变量的大小64。空闲内存指针已在内存中更新为0x160,那么现在在栈上就拥有变量“b”的内存位置。
与变量“a”的内存初始化相同。现在内存已增加到352字节,栈内仍然保存2个变量的内存位置。
最后,我们开始为数组“b”索引0赋值。代码指出?b?的值应该为1。该值被压入栈0x01。接下来发生向左移位,但是移位的输入为0,这意味着我们的值不会改变。接下来,要写入0x00的数组索引位置被压入堆栈,并检查该值是否小于数组0x02的长度。如果不是,则执行跳转到处理此错误状态的字节码的不同部分。MUL和ADD操作码用于确定需要将值写入内存中的哪个位置以使其对应于正确的数组索引。
0x20(10进制为32)*0x00(10进制为0)=0x00
需要记住,内存数组是32字节的元素,因此该值表示数组索引的起始位置。鉴于我们正在写入索引0,没有偏移量,也就是从0x00开始写入。
0x00+0x120=0x120
ADD用于将此偏移值添加到变量“b”的内存位置。偏移量为0,直接将数据写入分配的内存位置。最后,MSTORE将值0x01存储到这个内存位置0x120。
下图显示了函数执行结束时的系统状态。所有栈项都已弹出。请注意,实际上在remix中还有一些项目留在堆栈上,一个JUMP位置和函数签名,但是它们与内存操作无关,因此在EVMplayground中被省略了。
内存已更新为包含?b=1?赋值,在我们内存的倒数第三行,0值变成了1。可以验证该值位于正确的内存位置,b?应占用位置0x120-0x13f。
我们现在对合约内存的工作原理有了一定程度的了解。在后续需要编写代码时,将为我们提供很好理解与帮助。当你跳过一些合同操作码,看到某些内存位置不断弹出(0x40),现在就知道他们的确切含义了。
在本系列下一篇文章中,我们将在EVM深入探讨系列第3部分深入探讨合约存储的工作原理,了解存储插槽包装,揭开存储插槽的神秘面纱。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。