NTR:火爆出圈的最强 AI GPT 是否可用于合约安全审计?_TCO

近期ChatGPT爆火,其对传统文字工作的效率提高及总结能力让使用者惊艳。紧随其后CodeGPT这样基于GPT的插件出现,也充分体现了其对代码编写效率的提高。而最新GPT-4的发布,是否可以应用到对区块链、Solidity智能合约的审计中呢?

基于这样的疑问,我们进行了多种可行性测试。

测试环境及测试方法

测试使用的对比模型对象:GPT-3.5(Web),GPT-3.5-turbo-0301,GPT-4(Web)。

代码片段使用Prompt:HelpmediscovervulnerabilitiesinthisSoliditysmartcontract.

漏洞代码片段的检测对比

在此部分,我们分三次测试,使用历史上常见的漏洞代码作为测试一和测试二的用例,来验证其对基础漏洞的检测能力,测试三中使用中等难度的漏洞代码作为测试用例。

测试一

用例:《智能合约安全审计入门篇——Phishingwithtx.origin》

阿曼斥资3.7亿美元推出新的加密货币挖矿中心:金色财经报道,阿曼苏丹国推出一个新的加密采矿中心,这是该国十个月内开设的第二个采矿设施。该中心的建设成本为1.35亿阿曼雷亚尔(约合3.7亿美元),使用比特大陆技术公司的最新硬件,到2023年10月将安装1.5万台机器。该报告称,目前,该项目处于试点阶段,有2000台机器在线运行,耗电量为11兆瓦。

该采矿设施是加速阿曼经济数字化计划的一部分,阿曼经济主要依赖石油出口。另一个采矿中心于2022年11月开业,投资额为1.5亿阿曼雷亚尔(3.89亿美元)。2022年,该国运营商的电价为每千瓦时0.064卢比(0.166美元)。阿曼政府于2023年夏天发布了关于国家加密框架的咨询文件。该框架可能要求虚拟资产提供商在阿曼设立当地办事处。[2023/8/22 18:15:13]

漏洞代码:

对GPT进行提问:

GPT-3.5(Web)answer

声音 | 俄罗斯新任总理:俄罗斯很可能在今年春天采用一项新的加密税收计划:在最近的一次采访中,俄罗斯新任总理Mikhail Mishustin(曾任该国税务机构主管)表示,俄罗斯很可能在今年春天采用一项新的加密税收计划。他表示:“我相信有必要对此类活动征税,并正确评估使用加密货币的任何经济后果。”据悉,很多人对Mishustin加入俄罗斯正在组建的税收监管者名单感到兴奋。过去,他曾试图终止与增值税相关的欺诈行为,并曾追查在塞浦路斯、开曼群岛和其他税法非常宽松的地区藏匿资金的个人。Kick Ecosystem和Kick Ex交易平台创始人Anti Danilevski评论称:“我认为,新总理Mikhail Mishustin的到来,加大了俄罗斯进一步保护加密(投资者)和企业的可能性。他们现在所做的是至关重要的。”此前,Mishustin指出其工作的一些关键优先事项,并概述了俄罗斯进行体制改革的必要性。Mishustin说,国家应该实施现代信息技术,包括制定国家数字经济计划。据悉,俄罗斯主要公司,包括国家持有重大股份的一些公司,已经开始测试并将区块链技术应用于其运营的各个方面。(LiveBitcoinNews)[2020/1/20]

GPT-3.5-turbo-0301answer

GMO Internet推出两款新的加密货币:据Financemagnates消息,日本GMO互联网集团发布新款钱包和新款游戏币。一个为CryptoChips。这些是通过本地视频游戏促进加密货币转移的一种方式,其目的是让公司客户熟悉加密货币交易的概念。CryptoChips最初只支持比特币。第二款产品通过子公司GMO Coin发布,是Apple产品的加密货币钱包。它被称为“GMO钱币虚拟货币钱包”,并且客户可以开立账户并存入日元/加密货币。[2018/5/31]

GPT-4(Web)answer

可以看到结果:3个测试版本都发现了关键的tx.origin相关问题。

测试二

用例:《智能合约安全审计入门篇——溢出漏洞》

漏洞代码:

对GPT进行提问:

GPT-3.5(Web)answer

GPT-3.5-turbo-0301answer

GPT-4(Web)answer

可以看到GPT-3.5(Web)、GPT-3.5-turbo-0301都发现了关键的Overflow漏洞,出乎意料的是GPT-4(Web)居然没有相关提示。

测试三

用例:《空手套白狼——Popsicle被黑分析》

漏洞代码:

对GPT进行提问:

GPT-3.5(Web)answer

GPT-3.5-turbo-0301answer

GPT-4(Web)answer

对比结果,我们可以看到3个版本都未发现关键的漏洞点。

代码片段的检测总结

可以看到GPT模型对简单的漏洞代码块的检测能力还是不错的,但是对稍微复杂一点的漏洞代码暂时还无法检测,并且在测试中可以看到GPT-4(Web)的整体上下文可读性很高,输出格式清晰、舒服,但是其对代码的审计能力暂时没有远超GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分测试中由于Transformer输出存在一定的不确定性反而导致GPT-4(Web)遗漏了一些关键问题。

对比已知漏洞的全量合约检测

为了更加契合普通项目方在合约审计中的简单操作需求,这里我们提高些难度,针对代码量大的合约进行全量导入上下文,让GPT-4模型进行审计。

用例:《千万美元被盗——DeFi平台MonoXFinance被黑分析》

整份合约分批输入,在对话最后提出检测漏洞请求

这里使用Prompt:

Hereisasoliditysmartcontract

Contractcode

Theaboveisthecompletecode,helpmediscovervulnerabilitiesinthissmartcontract.

可以看到,GPT-4虽然在OpenAI公布的信息中其单次输入字符总数已经是当前最高,但还是会由于文本超长导致在最后提问时GPT会上下文缺失而只识别到部分内容,所以这样对大型合约而言就无法进行完整的上下文审计。

拆封整份合约,分批输入分批检测

这里使用Prompt:

对话1:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容1

对话2:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容2

对话3:

Helpmediscovervulnerabilitiesinthissoliditysmartcontract.

分段内容3

总结

GPT当前是否适合合约分析

优点

GPT对合约代码中基础的简单的漏洞具备部分检测能力,并且在检测出漏洞后会以很高的可读性来解释漏洞问题,这样的特性比较适合为初级合约审计工作者前期训练提供快速指导和简单答疑。

存在的问题

a.每次生成内容波动

GPT对每次对话的输出存在一定的波动,可以通过API接口参数进行调整,但是依旧不是恒定的输出,虽然这样的波动性对语言对话来说是好的方式,大大提高了对话给人的真实感。但是这对代码分析类的工作来说是一个不好的问题。因为为了覆盖AI可能告知我的多种漏洞回答,我需要多次请求同一问题并进行对比筛选,这无形中又提高了工作量,违背了AI辅助人类提高效率的基准目标。

例如这里再次运行"漏洞代码片段的检测对比测试二:

可以看到其输出结果比之前测试又多了一些额外内容。

b.漏洞分析能力依旧有很大的提高空间

对稍微复杂的漏洞进行检测即会发现当前的训练模型不能正确的分析并找到相关关键漏洞点。

GPT辅助合约审计的可行性和潜力分析

虽然当前来看GPT对合约漏洞的分析及挖掘能力还处于相对较弱的状态,但它对普通漏洞小代码块的分析并生成报告文本的能力依旧让使用者兴奋,在可预见的未来几年伴随这GPT及其他AI模型的训练开发,相信对大型复杂合约的更快速,更智能,更全面的辅助审计一定会实现。当科技发展可指数级提高人工的效率时就会发生质变,我们非常期待AI对区块链安全的助力,我们会持续关注新AI产品对区块链安全的影响。最后可见的将来我们必将与AI在一定程度上进行融合,愿AI和区块链与你同在。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

大币网

[0:31ms0-5:559ms