STA:StarkNet:发布性能路线图,为改进TPS做好准备_StarkMeta

概要

●?L2不受与L1相同的吞吐量限制。这为L2ValidityRollup带来更高的TPS。

●?StarkNet性能路线图解决了系统中的一个关键元素:定序器。

●?我们在此展示性能改进的路线图:

定序器并行化Cairo-VM的新Rust实现Rust中的定序器重新实现●?验证者,可以处理比现在更多的事情。

介绍

大约一年前,StarkNet在主网发布。一开始,我们主要集中构建StarkNet功能性。目前,我们将重点转移至通过一系列步骤提高性能,而这将有助于增强StarkNet体验。

在这篇文章中,我们将解释为什么广泛的优化只适用于ValidityRollup,并分享我们在StarkNet上实施这些步骤的计划。其中一些步骤已经在StarkNetAlpha0.10.2中实现,该版本于测试网和主网发布。但在我们讨论解决方案之前,让我们回顾一下区块受限问题及其原因。

区块空间限制:ValidityRollup与L1

在保持出块时间不变的情况下,提高区块链可扩展性和TPS的一种潜在方法是解决区块限制。这将需要区块生产者付出更多努力,需要更有效地实施这些组件。为此,我们现在将重点转移到StarkNet定序器优化上,我们将在以下部分中对此进行更详细的描述。

这里自然而然会出现一个问题。为什么定序器优化仅限于ValidityRollup,也就是说,为什么我们不能在L1上实现相同的改进并完全避免ValidityRollup的复杂性?在下一部分,我们将解释两者之间存在的根本区别,允许对不适用于L1的L2进行广泛的优化。

为什么L1吞吐量有限?

不幸的是,解除对L1的区块限制会遇到一个重大陷阱。通过提高区块链的增长率,我们也增加了对全节点的需求,他们试图跟上最新的状态。由于L1全节点必须重新执行所有历史记录,区块区间的大幅增加会给它们带来巨大压力,再次导致较弱的机器退出系统并将保留运行全节点的能力归向足够大的实体。最终,用户将无法自己验证状态,以及以去信任方式参与网络。

这让我们明白L1吞吐量应该受到限制,以维护一个真正去中心化和安全的系统。

为什么相同的问题不会影响ValidityRollup?

只有从全节点的角度考虑,我们才能看到ValidityRollup所提供的真正力量。L1全节点需要重新执行整个交易历史,以确保当前状态的正确性。StarkNet节点只需要验证STARK证明,而该验证所占用的计算资源量呈指数级下降。特别是,从头开始同步不一定涉及执行;一个节点可能会从其对等节点接收到当前状态的转储,并且只能通过STARK证明来验证该状态是否有效。这使我们能够在不增加全节点要求的情况下增加网络的吞吐量。

因此,我们得出结论,L2定序器会对整个优化范围带来影响,但这在L1上是不可能的。

未来的性能路线图

在接下来的部分中,我们将讨论目前哪些计划用于StarkNet定序器。

定序器并行化

我们路线图的第一步是将并行化引入交易执行。这是在昨天在主网上发布的StarkNetalpha0.10.2中引入的。我们现在深入了解什么是并行化。

那么“交易并行化”是什么意思?并行执行一个交易块是不可能的,因为不同的交易可能是相互依赖的。这在以下示例中进行了说明。一个包含来自同一用户的三笔交易的区块:

●?交易A:将USDC换成ETH

●?交易B:为NFT支付ETH

●?交易C:USDT换BTC

显然,TxA必须在TxB之前发生,但TxC完全独立于两者并且可以并行执行。如果每笔交易需要1秒来执行,那么通过引入并行化,出块时间可以从3秒减少到2秒。

问题的症结在于我们事先并不知道交易的依赖关系。实际上,只有当我们从示例中执行事务B时,我们才能看到它依赖于事务A所做的更改。进一步说,这一依赖性源于事务B从事务A写入的存储单元中读取这一事实。我们可以将交易画成一个依赖图,其中存在从交易A执行至交易B,当且仅当A写入一个由B读取的存储单元,因此必须在B之前执行。下图显示了依赖图的示例:

在上面的示例中,每一列都可以并行执行,这是最佳安排。

为克服事先不知道依赖图的事实,我们本着AptosLabs开发的BLOCK-STM的精神,将optimistic并行化引入到StarkNet定序器中。在该范式下,我们乐观地尝试并行运行事务并在发现冲突时重新执行。例如,我们可以并行执行图1中的交易1-4,之后才发现Tx4依赖于Tx1。因此,它的执行是无用的。在这种情况下,我们将重新执行Tx4。https://malkhi.com/posts/2022/04/block-stm/

请注意,我们可以在optimistic并行化之上添加许多优化。例如,与其天真地等待每次执行结束,我们转而可以在发现使它无效的依赖项时中止执行。

另一个例子是优化重新执行哪些交易的选择。假设包含图1中所有事务的块被送入具有五个CPU内核的定序器。首先,我们尝试并行执行交易1-5。如果完成顺序是Tx2,Tx3,Tx4,Tx1,最后是Tx5,那么只有在Tx4已经执行完之后,我们才会发现依赖Tx1→Tx4——说明应该重新执行。天真地,我们可能也想重新执行Tx5,因为考虑到Tx4的新执行,它的行为可能会有所不同。然而,我们可以遍历由执行已经终止的交易构建的依赖图,只重新执行依赖于Tx4的交易,而不是仅仅重新执行现在无效的Tx4之后的所有交易。

Cairo-VM的新Rust实现

StarkNet中的智能合约是在Cairo中编写的,并在Cairo-VM中执行,该规范出现在Cairo白皮书中。目前,定序器正在使用Cairo-VM的python实现。为优化VM实现性能,我们发起使用Rust重写VM的工作。感谢Lambdaclass的出色工作,他们现在是StarkNet生态系统中一个非常宝贵的团队,这项工作很快就会取得成果。

VM的rust实现,cairo-rs,现在可以执行原生Cairo代码。下一步是处理智能合约的执行,以及与pythonic定序器的集成。一旦与cairo-rs集成,定序器的性能有望显着提高。

Rust中的定序器重新实现

我们从python到rust以提高性能的转变不仅限于CairoVM。除了上述改进之外,我们还计划用Rust从头开始,重写定序器。除了Rust的先天优势之外,这还为序列器的其他优化提供了想象空间。举几个例子,我们可以享受cairo-rs的好处,而无需为python-rust通信支付费用,我们可以完全重新设计状态的存储和访问方式。

证明者

在整篇文章中,我们都没有提到ValidityRollup中最知名的元素——证明者。可以想象,作为可以说是架构中最复杂的组件,它应该是瓶颈,因此也是优化的重点。有趣的是,现在StarkNet的瓶颈是更“标准”的组件。今天,特别是对于递归证明,我们可以将比测试网/主网上的当前流量更多的交易放入证明中。事实上,目前,StarkNet区块与StarkEx交易一起得到证明,后者有时会产生数十万NFT铸造交易。

总结

并行化、Rust等——为即将到来的StarkNet版本中改进的TPS做好准备。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

大币网

[0:0ms0-3:848ms