近期ChatGPT爆火,其對傳統文字工作的效率提高及總結能力讓使用者驚艷。緊隨其后CodeGPT這樣基于GPT的插件出現,也充分體現了其對代碼編寫效率的提高。而最新GPT-4的發布,是否可以應用到對區塊鏈、Solidity智能合約的審計中呢?
基于這樣的疑問,我們進行了多種可行性測試。
測試環境及測試方法
測試使用的對比模型對象:GPT-3.5(Web),GPT-3.5-turbo-0301,GPT-4(Web)。
代碼片段使用Prompt:HelpmediscovervulnerabilitiesinthisSoliditysmartcontract.
漏洞代碼片段的檢測對比
在此部分,我們分三次測試,使用歷史上常見的漏洞代碼作為測試一和測試二的用例,來驗證其對基礎漏洞的檢測能力,測試三中使用中等難度的漏洞代碼作為測試用例。
測試一
用例:《智能合約安全審計入門篇——Phishingwithtx.origin》
楊東:區塊鏈比人工智能維度更高,火爆是必然的:據《中國產經新聞》報道,中國人民大學大數據區塊鏈與監管科技實驗室主任楊東在接受記者采訪時曾表示,區塊鏈作為信任傳遞的工具,能夠在沒有中心化節點的前提下實現陌生人之間的可信記賬,從而為金融交易和經濟生活的其他方面帶來巨大的機遇。有人曾稱區塊鏈是比人工智能更偉大的技術,這句話不無道理。從維度上來看,人工智能更主要是解決生產力,而區塊鏈更多的是解決生產關系,所以區塊鏈比人工智能維度更高,因此對經濟社會國家,乃至個人更具廣泛的影響和沖擊,因此區塊鏈火爆是必然的。[2018/5/26]
漏洞代碼:
對GPT進行提問:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
“區塊鏈大爺”火爆2018全球區塊鏈精英峰會會場:據火訊財經報道稱,4月28日,在2018全球區塊鏈精英峰會會場外,一個頭發花白的大爺吸引了很多人的注意,大爺手持宣傳牌,上面寫著“全球首個保潔鏈-Clean Chain,去中介化的保潔服務與管理”,同時發布需求“求技術合伙人!求交易所聯系方式!”在宣傳語中還表達了保潔行業是人類剛需,與區塊鏈技術相結合勢不可擋的強烈意愿。現場很多人稱其為“區塊鏈大爺”。[2018/4/28]
GPT-4(Web)answer
可以看到結果:3個測試版本都發現了關鍵的tx.origin相關問題。
測試二
用例:《智能合約安全審計入門篇——溢出漏洞》
漏洞代碼:
德意志銀行高管:比特幣火爆背后,銀行賬戶或將在5年內消失:德意志銀行高管馬庫斯申克認為,現在我們所熟悉的銀行賬戶可能會在短短五年內消失。“科技正在以不同的方式影響我們經營的業務,”申克指出零售銀行業務正“面臨一個全新的正常演變。”[2018/3/23]
對GPT進行提問:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
比特幣火爆:Coinbase去年營收超10億美元:隨著加密貨幣的價格暴漲,美國比特幣交易平臺Coinbase也實現了快速發展,并因此遭遇了硅谷創業公司難得一遇的煩惱:有太多投資者想要入股該公司。知情人士透露,這家成立6年的公司去年的營收突破10億美元大關,主要是因為人們對比特幣和其他虛擬貨幣的興趣激增所致。該公司去年8月估值為16億美元,現在至少翻了一番。知情人士表示,Coinbase截至去年9月30日僅能實現約6億美元的年營收,但感恩節和圣誕節期間的比特幣交易將其全年營收提升到10億美元以上。[2018/1/23]
可以看到GPT-3.5(Web)、GPT-3.5-turbo-0301都發現了關鍵的Overflow漏洞,出乎意料的是GPT-4(Web)居然沒有相關提示。
測試三
用例:《空手套白狼——Popsicle被黑分析》
漏洞代碼:
對GPT進行提問:
GPT-3.5(Web)answer
數字貨幣市場日益火爆 ETC或將迎來新的暴漲:進入12月份以來,數字貨幣市場進入了一個癲狂狀態,各種主流的數字貨幣一路狂飆,屢創新高。比特幣從6萬人民幣一周之內迅速暴漲至12萬人民幣,緊隨其后的是萊特幣和以太坊,萊特幣價格飆升至2000元的歷史最高點,以太坊價格上漲了一倍達到5000元的高點,瑞波幣也不甘寂寞兩天價格翻3番,刷新歷史最高紀錄。作為數字貨幣第二梯隊的萊特幣、瑞波幣均已經出現價格的暴漲,那么同為第二梯隊的以太經典(ETC)也多次嘗試價格上的突破。現以太經典最新成交價格為193.52元,最高價格達225.76元,最低價格174.67元。[2017/12/15]
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
對比結果,我們可以看到3個版本都未發現關鍵的漏洞點。
代碼片段的檢測總結
可以看到GPT模型對簡單的漏洞代碼塊的檢測能力還是不錯的,但是對稍微復雜一點的漏洞代碼暫時還無法檢測,并且在測試中可以看到GPT-4(Web)的整體上下文可讀性很高,輸出格式清晰、舒服,但是其對代碼的審計能力暫時沒有遠超GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分測試中由于Transformer輸出存在一定的不確定性反而導致GPT-4(Web)遺漏了一些關鍵問題。
對比已知漏洞的全量合約檢測
為了更加契合普通項目方在合約審計中的簡單操作需求,這里我們提高些難度,針對代碼量大的合約進行全量導入上下文,讓GPT-4模型進行審計。
用例:《千萬美元被盜——DeFi平臺MonoXFinance被黑分析》
整份合約分批輸入,在對話最后提出檢測漏洞請求
這里使用Prompt:
Hereisasoliditysmartcontract
Contractcode
Theaboveisthecompletecode,helpmediscovervulnerabilitiesinthissmartcontract.
可以看到,GPT-4雖然在OpenAI公布的信息中其單次輸入字符總數已經是當前最高,但還是會由于文本超長導致在最后提問時GPT會上下文缺失而只識別到部分內容,所以這樣對大型合約而言就無法進行完整的上下文審計。
拆封整份合約,分批輸入分批檢測
這里使用Prompt:
對話1:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容1
對話2:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容2
對話3:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容3
總結
GPT當前是否適合合約分析
優點
GPT對合約代碼中基礎的簡單的漏洞具備部分檢測能力,并且在檢測出漏洞后會以很高的可讀性來解釋漏洞問題,這樣的特性比較適合為初級合約審計工作者前期訓練提供快速指導和簡單答疑。
存在的問題
a.每次生成內容波動
GPT對每次對話的輸出存在一定的波動,可以通過API接口參數進行調整,但是依舊不是恒定的輸出,雖然這樣的波動性對語言對話來說是好的方式,大大提高了對話給人的真實感。但是這對代碼分析類的工作來說是一個不好的問題。因為為了覆蓋AI可能告知我的多種漏洞回答,我需要多次請求同一問題并進行對比篩選,這無形中又提高了工作量,違背了AI輔助人類提高效率的基準目標。
例如這里再次運行"漏洞代碼片段的檢測對比測試二:
可以看到其輸出結果比之前測試又多了一些額外內容。
b.漏洞分析能力依舊有很大的提高空間
對稍微復雜的漏洞進行檢測即會發現當前的訓練模型不能正確的分析并找到相關關鍵漏洞點。
GPT輔助合約審計的可行性和潛力分析
雖然當前來看GPT對合約漏洞的分析及挖掘能力還處于相對較弱的狀態,但它對普通漏洞小代碼塊的分析并生成報告文本的能力依舊讓使用者興奮,在可預見的未來幾年伴隨這GPT及其他AI模型的訓練開發,相信對大型復雜合約的更快速,更智能,更全面的輔助審計一定會實現。當科技發展可指數級提高人工的效率時就會發生質變,我們非常期待AI對區塊鏈安全的助力,我們會持續關注新AI產品對區塊鏈安全的影響。最后可見的將來我們必將與AI在一定程度上進行融合,愿AI和區塊鏈與你同在。
Tags:GPT區塊鏈APIGPT價格GPT幣區塊鏈工程專業學什么區塊鏈存證怎么弄區塊鏈技術發展現狀和趨勢API價格API幣
撰文:十文 Binance與FTX的劇情在一夜間經歷了兩次翻轉,從爭論到收購再到監管的不確定性,整個大盤也隨之短暫上漲后又急劇下跌.
1900/1/1 0:00:00一些權威人士認為,比特幣近期暴跌的背后是當前傳統市場的不穩定,而另一些人則認為,所謂的PlusToken騙局才是原因所在.
1900/1/1 0:00:00幣安在其平臺上為Visa和萬事達卡的購買增加了15種法定貨幣選項。自2月14日起,該交易所的合作伙伴Simplex可以在世界范圍內的許多國家用來購買加密貨幣.
1900/1/1 0:00:00美國司法部長WilliamBarr發布了加密貨幣市場的官方指導方針。根據美國司法部10月8日的一份聲明,美國網絡數字特別工作組制定了這些指導方針,官方將其稱為《加密貨幣:執行框架》.
1900/1/1 0:00:00穩定幣是一類獨特的加密貨幣,已成為數字資產生態系統的關鍵組成部分,在傳統金融世界和去中心化金融創新領域之間架起了一座橋梁。這些數字資產旨在通過與資產儲備掛鉤來最大限度地減少價格波動.
1900/1/1 0:00:00在過去一個小時內,包括Coinbase和幣安在內的主要交易所的比特幣價格超過了1.1萬美元。此前,加密貨幣市場持續了近兩周的低波動,比特幣價格被壓在多個阻力位以下.
1900/1/1 0:00:00