簡述
近期“AI+Web3”的熱度上升,相關概念Token也迎來了一波漲幅,由于很多加密圈的朋友并不是非常了解AIGC,這可能會導致投資失誤或者錯過潛在的機會。我從去年1月份開始關注AIGC,親身經歷了2022年AIGC技術和產業的高速發展,今天我就跟大家簡單解讀一下現在AIGC的發展格局、AI+Web3項目的現狀以及如何使用AIGC工具創作Web3資產。
AIGC
AI模型分類
從模型功能上區分,目前AIGC主要涉及文字、圖片、音樂和視頻的生成。
文字
文字模型現象級應用當屬OpenAI的ChatGPT,續寫文字、創作故事、寫代碼、修BUG、寫詩、做表......你所有能想象到的與文字相關的內容它都可以做。它可以極大程度上減少人的工作量,使用得當將會是文字工作者的利器。現在媒體平臺上很多文章都是用AI寫的,這一領域有很多潛在的機會,解決實際問題,創造新的工作流,打造商業閉環是我們這些使用工具的人需要去考慮的事情。
ChatGPT
ChatGPT可以幫助開發人員完成大量的代碼編寫工作,還可以查找修改錯誤,當然它有可能出錯,在使用中需要留意,盡信書不如無書。
ChatGPT編寫代碼
此外,各類建議、策劃、編撰等文字工作是它最擅長的,對于文字工作者來說,ChatGPT絕對是超強的輔助工具。
ChatGPT給予加密投資建議
但是ChatGPT不是萬能的,你可以將其定義為一個什么都懂一些的“全才”,但它卻不是精通一切的“專家”。對于某些比較專業的知識,它的回答可能會出錯,這包括但不限于編程細節、密碼學、數學、歷史等領域,所以在使用ChatGPT的時候最好對內容再復核一遍,以免出現嚴重錯誤,在最近的版本更新中,ChatGPT很多錯誤點已經得到了修正,隨著模型的逐步完善,未來的想象力是無限的。
圖片
AI生成圖片是AIGC領域發展最快的賽道,2021年最火的技術還是生成對抗網絡,但是它距離產品化還有很長的距離;到了2022年初,DiscoDiffusion橫空出世引發了第一波AIGC爆點,DiscoDiffusion擅長對場景的刻畫,出圖場面恢弘大氣,但是畫面不夠清晰,作圖速度慢,要以10分鐘計數;4月份,OpenAI的DALLE2上線,7月份Midjourney開放公測,使用Discord端作畫,1分鐘之內可以同時出4張圖,藝術性超高,在11月份發布V4版本后進一步穩固了自己最強AI作畫工具的地位;8月份,StableDiffusion正式發布,作圖速度縮短至10秒之內,圖片細節、清晰度都有極大的提升,并且奉行開源主義,所有代碼都開源,這也誕生了龐大的社區,是之后世界范圍內AIGC流行的火種,包括后面基于StableDiffusion訓練的專門生成二次元圖像的NovalAI。
Phaver發布新版本,添加照相功能并允許直接在應用內連接多個錢包的NFT:7月5日消息,基于Lens Protocol上的Web3社交應用Phaver宣布發布6.8.2版本更新,新增多個朋友標記,添加Phaver自己的照相功能和新的照片編輯器,還允許用戶直接在應用內連接來自多個錢包的NFT。[2023/7/5 22:18:12]
如今AI作圖領域呈現?Midjourney+StableDiffusion?的雙巨頭局勢,DiscoDiffusion和DALLE2在技術更新上已經離開了第一梯隊,其余產品大多都是基于StableDiffusion的開源框架調整的。
從左到右:discodiffusion、midjourney、stablediffusion、novalai
音樂&視頻
AI生成音樂和視頻是一個發展相對較慢的賽道,至今還沒有現象級應用,市場上存在的產品均不太成熟,其在技術難度上比生成圖片和文字要大,但是已經有很多公司準備在2023年攻克這個難題,或許我們馬上就能看到比較成熟的視頻和音樂生成平臺。下面我挑選幾個相對優秀的產品簡單介紹一下。
AI生成音樂最常見的玩法是用戶輸入一段文字或者一張圖片,模型根據內容輸出一段音樂,對應的產品可以關注?Riffusion,它除了實現以上功能外還能在不同風格輸入之間自然轉換。
Riffusion
AI生成視頻可以體驗產品?QuickVid,它可以在很短的時間內根據文字描述生成一段流暢的視頻,你還可以選擇不同使用場景下的視頻風格,視頻質量較高,與人為剪輯的效果差別不大。
QuickVid
AIGC+Web3玩法
AIGC可以助力Web3項目更快更好的完成文字和圖片的設計工作,這在NFT和GameFi項目中應用最為廣泛,但是這也需要一定的技巧,使用恰當的Prompt使AIGC輸出可用的圖片,并使用ChatGPT完成項目文案相關工作,描述詞的使用有很多講究,成為一名AI藝術家需要很多的前期學習,為了讓大家快速完成需求,下面我簡單說幾種使用AIGC輸出Web3可用圖像的方法。
目前為止大約有50000個用戶擁有SNS名稱:金色財經報道,一種稱為Sats Names的新趨勢,Sats Names也稱為SNS,是使用Ordinal銘文在比特幣區塊鏈上創建名稱的標準。根據Sats名稱文檔,截至2023年6月,已登記了250,000個.sats名稱,另外還登記了.ord、.btc和.xbt等其他命名空間的120,000個SNS名稱。文檔顯示,到目前為止,大約有50,000個用戶擁有SNS名稱,并且Unisat錢包和Ordinals錢包支持SNS名稱解析。[2023/7/2 22:12:38]
特殊Prompt
有一些特殊的Prompt可以控制模型輸出特定風格的圖片,這些圖片可以直接拿來作為NFT或者GameFi內素材使用,版權屬于創作者自己。下面我使用StableDiffusion做一些示范。直接復制我下面的描述詞,自己定義括號中的內容。
塑料雕像
注:只需要改變括號中的內容就可以得到相同類型的圖片,示例文字順序=圖片順序,圖片內角色依次為Yoda、Superman、ironMan、MaiShiranui、shark、batman、Bumblebee和wizard。你可以嘗試所有其他可能性。Funkypopfigurine,madeofplastic,productstudioshot,onawhitebackground,diffusedlighting,centered
AIGC3D雕像
這類圖片直接發一個NFT項目綽綽有余,每個都是1/1,你只需要告訴AI想要什么。
模塊建筑
這段描述詞中的?temple?可以改也可以不改,都可以做出不錯的效果圖。Tinycuteisometric?temple,softsmoothlighting,softcolors,softcolors,100mmlens,3dblenderrender,trendingonpolycount,modularconstructivism,blueblackground,physicallybasedrendering,centered
AIGC建筑
這類圖片可以構建一個土地NFT項目或者游戲中的建筑。
3D矢量風格動物
蘇富比將于12月13日拍賣另一幅私人手中僅存的第一版美國憲法副本:11月2日消息,蘇富比宣布將于12月13日拍賣另一幅私人手中僅存的第一版美國憲法副本,拍賣前該憲法副本將于11月4日至22日在蘇富比約克大道畫廊公開展出,11月30日至12月12日在紐約再次展出。本次拍賣的憲法副本,最后一次出現在1894年的費城拍賣會上,此次拍賣是125年以來首次拍賣,估價為20/30萬美元。
據悉,該副本為美國制憲會議和大陸會議代表制作的僅有的13份官方印刷品之一,其中11份被著名的機構和政府收藏,另一份副本在去年11月進行了拍賣。當時,ConstitutionDAO為贏得拍賣,從1.7萬名貢獻者手中籌集了超過4000萬美元的以太坊,最終該副本被Citadel的創始人兼首席執行官KennethGriffin以4320萬美元拍下。[2022/11/2 12:08:46]
通過改變粗體內容,生成不同的矢量動物形象kawaiilowpoly?panda?character,3disometricrender,whitebackground,ambientocclusion,unityengi
AIGC矢量動物
3D游戲風格房間
可改變粗體內容,生成不同的房間Tinycuteisometric?living?roominacutawaybox,softsmoothlighting,softcolors,purpleandbluecolorscheme,softcolors,100mmlens,3dblenderrender
AIGC3D房間
通過以上案例我們可以看到,AIGC可以在圖片設計上輔助甚至取代畫師,你可以創造出獨一無二的藝術風格、角色,而不需要掌握繪畫的技巧,這是生產力的極大進步。
模型訓練
以上工作流使用的是開源的StableDiffusion通用模型,它無法生成模型素材中不存在的東西,比如你無法讓它生成一只無聊猿,模型本身也不知道什么是無聊猿,所以它存在局限性和時效性。為了解決以上提到的問題,我們可以訓練自己的模型,將需要的素材都放進去,從而使模型輸出內容符合我們的預期,這在NFT二創、擴展,GameFi輔助設計等方面都有很大的應用潛力。
展示幾張我訓練的無聊猿模型二創成圖效果,從左到右分別是蝙蝠俠風格,黏土風格,畢加索抽象風格和黃金材質:
Grace Peters:美國通脹放緩意味著美聯儲可能將加息速度從75個基點降至50個基:8月11日消息,摩根大通私人銀行投資策略主管Grace Peters稱:(美國通脹放緩)這是很長時間以來我們首次聽到一點好消息,因此市場可能會延續這波漲勢。我們認可通脹的走向,但如果深入研究CPI數據,會發現通脹的范圍很廣,黏性很強,從現在開始只會緩慢下降。以上意味著美聯儲可能將加息速度從75個基點降至50個基點。(金十)[2022/8/11 12:19:04]
無聊猿二創
當然也可以控制生成與原本項目圖片相似度極高的圖片,下列四張圖片有兩張原圖,兩張用無聊猿模型生成的圖,幾乎很難分辨,你可以猜一下,后面我會揭曉答案。
無聊猿模型復刻
模型訓練原理很簡單,用自己提供的圖片訓練出一個專屬模型,但是讓普通人從零開始訓練一個AIGC模型是很困難的,好在StableDiffusion給我們提供了一些比較簡單的模型訓練方法。
現在常用的技術方案有三種:Fine-Tuning、DreamBooth、Textual-Inversion
特性解釋:
Fine-Tuning--模型訓練、原生框架優點:功能最全,效果最好,prompt控制精確,是優質精細模型的統一技術方案缺點:訓練復雜,硬件要求高,訓練時間長,訓練圖片需要標記詞DreamBooth--模型訓練、簡易框架、添加特殊標識符優點:訓練簡單、速度快、硬件要求相對低、不需要精確的圖片標記詞,能較好地生成不同風格的圖片,開放模型最常用方案缺點:受限于的表示方式,訓練SD模型中不存在的類效果會差一些,整體出圖質量低于Fine-Tune,模型文件:2-4GTextual-Inversion--新定義特征向量,不改變模型本身優點:需要圖片數量少:3-5張,訓練文件小:幾十KB缺點:對于原SD中不存在的創新的物體、畫風等出圖效果不好,暫無商業用例綜合考慮成本與難度,新手推薦使用DreamBooth訓練自己的模型,這里我給大家找了一個最簡單的Colab版本,它可以使用谷歌免費的服務器訓練模型并生成圖片,前期需要處理的素材也最少。
訓練模型之前,你需要訓練使用的準備圖片,初次嘗試最好在10張左右,尺寸512*512,如果圖片尺寸不合適可以使用BIRME等工具調整。
芯動科技發布A10pro 500M、A10pro 720M服務器的ETC固件:7月31日消息,芯動科技發布關于ETC固件發布的公告,具體內容如下:
基于未來以太坊共識機制(算法)POW轉POS的情況,應廣大客戶要求,我們開發了A10pro 500M、A10pro 720M服務器的ETC固件,現已通過測試,在此公開發布,方便客戶使用。經測試,目前A10pro 720M服務器的ETC算力對比ETH算力,有大約10%左右的提升,A10pro 500M服務器的算力沒有變化。
A11服務器的ETC固件目前正在開發中,開發完成后會公告發布。[2022/7/31 2:49:09]
打開上面的鏈接,也就是:https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
主頁顯示如下,這是一個即時更新的頁面,它不會保存你的更改,你可以直接在這個頁面使用,或者點擊“文件”選擇“在云端硬盤中保存一份副本”,打開副本頁,這個頁面會保存你的所有更改。
Colab版本DreamBooth
備份
之后我們開始模型訓練,首先點擊第一行的運行按鈕,連接Google云端硬盤,安裝到gdrive。
鏈接云盤
運行完成后在按鈕前面會出現綠色的對勾,右上角RAM/磁盤也出現綠色對勾,后面每段程序運行完成的標志都是這個小對勾。上一段程序運行結束后,點擊下一段的按鈕繼續運行。
運行完成標志
接下來安裝依賴,下載模型
安裝依賴
下載模型
開始正式訓練,首先為你的模型起個名字。
設置模型信息
上傳圖片,點擊運行后會出現“選擇文件”按鈕,選定圖片后上傳,我這里選擇了八張CloneX的圖片作為訓練素材,并為它們命名為CloneX1-8,這里對圖片的命名不要與已有單詞相同,它是對你訓練素材的特殊標記。圖片命名方式可以參考下圖。
上傳訓練圖片
訓練素材
運行Captions,并跳過Conceptimages
開始訓練,訓練步數設置為圖片數量*100,我是用了八張圖片,這里選擇800,其他參數暫時不需要調整,等后面熟練掌握了模型訓練方法再進行更精準的訓練。
設置訓練參數
點擊運行,出現以下界面表示訓練開始,等待訓練完成。這里有兩個訓練過程,一個是訓練文字,一個是訓練圖片。
訓練模型
訓練完成后直接運行測試模型,這里不需要調整參數。
測試模型
程序運行完后會出現一個鏈接,點擊打開到可以作圖的WebUI界面。
測試鏈接
WebUI的主頁如下,1處選擇使用的模型,2處輸入描述詞,也就是你對想要輸出圖片的內容,3處輸入負面描述詞,也就是你不想要圖片出現什么內容,3可以空著不填。填寫完描述詞后點擊生成圖片。
WebUI主界面
因為我們對圖片的標記是CloneX,所以我們生成圖片時前部分要指定主體,這里推薦固定句式“apictureofclonexwith+......”,with后面加對圖片的描述,每個描述詞之間用逗號隔開。
簡單測試,這里輸入提示詞“apictureofclonexwithbeautifulgirl,redhair”,結果應該會出現一個紅色頭發的女生CloneX形象,效果如下圖:
CloneX模型測試1
測試2,輸入提示詞:“apictureofclonexwithbeautifulgirl,Longgreenhair,blackcoat,yelloweyes”也就是綠色長發、黑色外套、黃色眼鏡的女CloneX,生成效果如下
CloneX模型測試2
從以上兩個簡單測試來看,用10張以內的素材圖片訓練的模型就可以很好的生成想要的圖片,而且這些CloneX是原本不存在的,是你創造了它們!以后喂10張圖給AI,它可以給你10,000張圖,這是生產力質的提升。
我把這個訓練的模型上傳到了?Huggingface,有興趣的朋友可以拿去玩,在訓練過程中遇到什么問題也可以聯系我。鏈接:https://huggingface.co/wheart/clonexnft
上傳模型文件
HuggingFace模型
揭曉答案,無聊猿那四張圖片,前兩張是AI生成的,后面兩張是原圖。
現有AI+Web3項目簡析
隨著AIGC的興起、ChatGPT的爆火、微軟對AI百億投資等事件的鋪墊,Crypto很多AI項目也得到了更多的關注,諸如AGIX之類的AI概念Token都迎來了一波不錯的漲幅。但是就目前這些AI+Web3的項目來看,我并沒有發現真正有想象力的產品。這段時間受到關注的項目大都是很久之前的老項目,所以只能看作是版塊輪動帶動了它們,長線來看沒有好的標的。如果后面出現基于新AI技術做的產品或許可以關注。
目前很多Crypto大佬,像CZ、Vitalik都對AI技術產生了興趣,所以對于AI+Web3之后的發展,我個人認為還是值得期待的。
V神對ChatGPT的測評
CZ的AI形象
總結
綜合來看,目前AIGC在Web3的應用還處于非常初級的階段。現階段利用好AI工具可以對項目的設計、開發、運營工作提供極大的便利,下一階段肯定會出現更多優秀的產品,我們要做的就是學習、使用、分析、發現,比大部分人多走一步,不錯過AIWeb3這趟車。
2022年12月的第一周,“Metaverse”一詞被當選為《牛津英語詞典》的年度詞匯,排名第二。在該詞匯競賽中,30多萬人票選出富含長久文化含義的詞匯,以反映過去一年的社會氣質和公眾情緒.
1900/1/1 0:00:00每個人都在尋找替罪羊。相反,我們需要照照鏡子。? 因為罪惡隨處可見。? 在每一個歡欣鼓舞的會議廳中,在每一個聳人聽聞的YouTube視頻中,在內部人士和他們的辯護者臉上的每一個假笑中,在每一個被.
1900/1/1 0:00:00比「GPT偵探」更重要的是,AI生成內容在不同行業的「容忍度」。圖片來源:由無界版圖AI工具生成 作者|美漪編輯?|靖宇 最近兩個月,科技圈最熱的話題,無疑是OpenAI推出的對話式AI應用Ch.
1900/1/1 0:00:00TL;DR FTX崩潰和市場波動導致TRONDAO轉移儲備,如果僅考慮穩定幣和BTC儲備,則USDD的抵押不足;但若包括TRX存款在內.
1900/1/1 0:00:00介紹 你是否對永續合約的運作方式感到好奇并想探索去中心化交易的全部潛力?你選對了文章,這是你正確評估最成功、最獨特的去中心化衍生品交易的交易所之一的第一步.
1900/1/1 0:00:00引言 一直以來,NFT市場都在致力于解決「流動性不足」的問題,從NFT的估值定價、撮合方式等方面切入,許多優秀的產品和創新機制不斷出現推進了NFT金融化的持續發展.
1900/1/1 0:00:00