摘要
事件:11月30日,OpenAI上線了新模型ChatGPT,其網頁應用允許用戶免費使用,ChatGPT能夠理解人類語言并且回答問題,不限于普通聊天、協助寫代碼、解決具體難題等等應用場景。因為其高質量的回答、高效獲取信息的方式、以及上癮式的交互體驗,ChatGPT引起了社交媒體的廣泛傳播與關注。
ChatGPT效果出人意料,“全能AI”火遍社交媒體。ChatGPT的交互界面簡潔,只有一個輸入框,AI將根據輸入內容進行回復,并允許在一個語境下持續聊天。ChatGPT的聊天范圍廣泛,涵蓋大部分領域,根據親身體驗以及社交媒體分享的內容來看,ChatGPT能在絕大部分知識領域給出專業回答,同時對輸入的理解能力和包容度高。無論是讓ChatGPT寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議都不在話下,其回復內容每次都是隨機的,但總體保持著一定的專業性和信息量,具備很強的參考意義。與ChatGPT持續對話是一種令人上癮的體驗,因此在該應用發布的短短幾天內,就能看到國內外的社交媒體上就有大量關于ChatGPT對話的分享。
ChatGPT的背后離不開大模型、大數據、大算力。ChatGPT成為AIGC里程碑的背后,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調后的GPT-3.5系列模型,有著多達1750億個模型參數,并在今年年初訓練完成。模型訓練的背后離不開大數據的支持,OpenAI主要使用的公共爬蟲數據集有著超過萬億單詞的人類語言數據集。在算力方面,GPT-3.5在Azure AI超算基礎設施(由V100GPU組成的高帶寬集群)上進行訓練,總算力消耗約3640 PF-days(即每秒一千萬億次計算,運行3640個整日)。
英國法官裁定Craig Wright在比特幣侵權案中敗訴:金色財經報道,英國法官本周裁定,比特幣區塊鏈的文件格式不受版權保護,裁定自稱為比特幣發明家的“澳本聰”Craig Wright敗訴。Wright 聲稱,他以化名中本聰 (Satoshi Nakomoto) 撰寫了 2008 年比特幣白皮書,并且有權利阻止比特幣和從中分叉出來的系統比特幣現金的運行,因為它們侵犯了他的知識產權。James Mellor 法官表示,比特幣的文件格式——頭部序列和交易列表共同構成一個區塊——不能被視為版權作品,因為 Wright 無法展示它們是如何被首次記錄的,關于 2008 年白皮書版權的索賠以及 Wright 是否真的是作者,將是以后裁決的主題。[2023/2/9 11:56:14]
AIGC不僅改變創作,還將改變獲取信息的主要方式。在之前的報告中,我們討論過AIGC對于創作的替代,降低了創作門檻,為元宇宙數字內容的豐富打下基礎。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今的搜索引擎,ChatGPT或許在未來會改變我們獲取信息、輸出內容的方式,AIGC有望成為數字經濟時代驅動需求爆發的殺手級應用。
模型缺點瑕不掩瑜,未來迭代值得期待。據官網顯示,ChatGPT目前存在著一些局限性,包括:有時會給出看上去正確但荒謬的答案、微調提問的方式會得到完全不同的答案、有時會反復使用某些句子等等。在我們實際體驗中也能感受到,這些問題來自訓練過程和數據集的局限性。ChatGPT本次面向用戶免費開放能夠進一步強化訓練,從而完善模型質量。
Coinbase工程師Craig Hammel加入Moralis擔任高級技術顧問:12月2日消息,Moralis是一個去中心化應用程序 ( DApp ) 平臺,Coinbase工程師Craig Hammel加入該公司擔任高級技術顧問,Craig Hammel將把他的知識用于Moralis項目,增強其擴展和整合其他區塊鏈的能力。Hammel還將協助Moralis將其工具引入移動設備和游戲引擎,例如Unity。
據此前報道,總部位于斯德哥爾摩的下一代區塊鏈開發平臺Moralis完成1340萬美元種子輪融資,EQT Ventures領投。(dailycoin)[2021/12/3 12:47:23]
投資建議:軟硬件與數據集。生成算法、NLP與算力決定AIGC能否運行,而高質量的數據集決定了AIGC質量與商業模式。軟件層面主要包括自然語言處理技術:谷歌、微軟、科大訊飛、拓爾思;AIGC生成算法模型及數據集:視覺中國、萬興科技、藍色光標、昆侖萬維;算力層包括:三大運營商(移動、電信、聯通)、英偉達、瀾起科技、中興通訊、新易盛、天孚通信、中際旭創等。
11月30日,OpenAI上線了新模型ChatGPT,該模型允許用戶以對話的方式與其交互。ChatGPT是之前發布的InstructGPT的兄弟模型,后者被訓練用于根據輸入給出詳細的一段輸出。同時,ChatGPT模型為了獲得更多用戶反饋,在目前階段對用戶開放免費使用,用戶可通過chat.openai.com進行應用交互體驗。
Craig Wright:數字貨幣無需制定新法律:澳本聰(Craig Wright)最新博客文章中提到,世界并不需要一套適用于數字貨幣的新法律,但有必要確保法官和立法者了解比特幣和其他區塊鏈系統。推動專門法律并不能增進了解和消除不確定性。(coingeek)[2020/7/6]
ChatGPT的交互界面簡潔,只有一個輸入框,用戶可以任意開啟話題或者給出指令,模型將根據輸入內容給出輸出。ChatGPT的一大特點就是允許在同一個語境下持續交流,能夠根據上下文進行回復。
ChatGPT的聊天范圍廣泛,涵蓋大部分領域,具備參考意義。根據親身體驗以及社交媒體分享的內容來看,ChatGPT能在絕大部分知識領域給出專業回答,同時對輸入的理解能力和包容度高。無論是讓ChatGPT寫首押韻的詩、檢查代碼的bug、回答科學問題、對推特未來的發展提出建議都不在話下,其回復內容每次都是隨機的,但總體保持著一定的專業性和信息量,具備很強的參考意義。
ChatGPT的對話內容開始在社交媒體引起關注。因為ChatGPT對話的隨機性以及較為豐富的信息量,與ChatGPT持續對話令人上癮,在該應用發布的短短幾天內,國內外的社交媒體上就有大量關于ChatGPT對話的分享。這其中包括馬斯克向ChatGPT請教如何改變推特,也有各類有趣的問答合輯。
動態 | 在最新法庭文件中 Craig Wright聲稱獲得96億美元比特幣的私鑰:根據1月14日向美國佛羅里達州南部地區法院提交的一份法庭文件,此前提及的備受期待的“保稅快遞員”中間人已經到來,他“提供了解鎖加密文件所需的信息和密鑰片段”,表示CSW擁有解鎖96億美元比特幣所需的私鑰。Bloom法官對保稅快遞公司的存在和比特幣爭議的數量表示懷疑。CSW此前因未能出示其所持比特幣的完整清單而被判藐視法庭。(CoinDesk)[2020/1/15]
AIGC里程碑的背后離不開大模型、大數據、大算力。ChatGPT成為AIGC里程碑的背后,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。由OpenAI研發的ChatGPT是微調后的GPT-3.5系列模型(GPT模型專門用于人類語言應用),有著多達1750億個模型參數,并在今年年初訓練完成。
模型訓練的背后離不開大數據的支持,公共爬蟲數據集有著超過萬億單詞的人類語言數據集,OpenAI團隊在此基礎上進行整理加工形成用于訓練模型的數據集。在算力方面,GPT-3.5在Azure AI超算基礎設施(由V100GPU組成的高帶寬集群)上進行訓練,總算力消耗約3640 PF-days(即每秒一千萬億次計算,運行3640個整日)。
Craig Wright已收到因盜取已故IT專家Dave Kleiman價值百億美元比特幣的傳票:據ccn報道,自稱比特幣創始人的Craig Wright已收到官方傳票,因其盜竊早期比特幣采納者Dave Kleiman的100億美元比特幣。目前居住海外的Wright必須在4月16日之前回復傳票;。其原本需要在更早作出回應,法院曾授予他延期。法院文件還顯示,律師Andres Rivero曾前幾次聽證會中代表他,但他本人和律師都沒有公開處理這件訴訟。昨日在東京舉行的論壇上,以太坊創始人V神稱其為騙子。[2018/4/5]
AIGC不僅改變創作,還將改變獲取信息的主要方式。在之前的報告中,我們討論過AIGC對于創作的替代,降低了創作門檻,為元宇宙數字內容的豐富打下基礎。而在此之上,ChatGPT所展示了作為生產力的存在,ChatGPT在尋找答案、解決問題的效率上已經部分的超越了如今谷歌等搜索引擎,ChatGPT或許在未來會改變我們獲取信息的方式,AIGC成為新時代的用戶入口。
模型缺點瑕不掩瑜,未來迭代值得期待。官網注明了ChatGPT目前存在著一些局限性及原因,在我們的實際體驗中,也確實遇到這些問題:
1)有時ChatGPT會寫一些看上去合理但錯誤且荒謬的答案,這個在體驗中較少但會出現。據官網描述,這個問題是難以解決的,因為:第一,在訓練期間,并沒有提問者目前所有的事實;第二,如果讓模型過于謹慎,那么他能回答的問題也會拒絕回答;第三,有觀察的訓練誤導了模型,因為正確的答案來源于模型的數據庫而非人類知道什么。
2)ChatGPT對輸入的改變比較敏感。例如,給出一句問題,模型聲稱無法得知答案,但輕微地改變問題,就能正確地回答。這種特性在體驗中表現的比較明顯。
3)ChatGPT有時會非常重復表達,反復使用某些句子,例如:重申自己是OpenAI訓練的語言模型。這個問題在我們的體驗中也經常出現,根據官網,該問題來自于訓練數據的偏差,以及過度擬合問題。
4)在理想情況下,當用戶問題模糊時,模型應該會提問將問題清晰化。但目前的模型經常不去追問問題,直接猜想用戶可能問的方向。
除了官網提到的局限性外,根據實際體驗,ChatGPT即使在輸入的明確要求下,也難以在表達中使用數據支持,這可能是因為ChatGPT所使用的語言數據集并不包含太多關于數據的內容。
相比于此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結合的潛力,例如我們試著讓其解釋“光學模塊中的光芯片和電芯片是什么?當前的全球主流供應商是誰?中國企業的競爭地位如何?未來是否有什么技術可以替代InP材料?”這類問題時,ChatGPT能夠給出頗為專業的答復,且語言表達流暢。如果將ChatGPT與Midjourney等創作工具融合,有可能直接輸出設計圖稿等內容,畢竟文字生成是基礎,而用戶要做的盡量調整自己的輸入,以促使AI輸出更質量的內容,這本身也是一種訓練和反饋過程。目前部分用戶已在社交媒體上表達了對ChatGPT的付費意愿,可見C端用戶為了提高效率有意愿訂閱此類服務。
目前OpenAI等巨頭已著手自建計算集群來滿足AIGC的要求,這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創業團隊目前基于公有云訓練,隨著需求的增加,也有望轉向自建集群。
今年以來,我國“東數西算”戰略自上而下快速推進,作為數字經濟的基礎,“算力即權力”,其重要性不言而喻,此前我們更多的互聯網應用聚焦于“存”而非“算”,隨著AIGC技術在全球的興起,“東數西算”的算力需求將越來越顯著。
關于AIGC的投資策略,能夠從軟硬件與數據集的三個角度梳理,生成算法、NLP與算力決定AIGC能否運行,而高質量的數據集決定了AIGC質量與商業模式。
軟件層面主要包括自然語言處理技術:谷歌、微軟、科大訊飛、拓爾思。
AIGC生成算法模型及數據集:藍色光標、視覺中國、昆侖萬維、萬興科技。
風險提示
技術創新不及預期:AIGC的技術發展不及預期,以及底層硬件技術,如:超級計算機,算力的發展不及預期。
政策監管風險:目前AIGC還處于相對早期,后續是否會出臺AIGC作品相關的知識版權或其他法律監管條款尚不明確。
本文節選自國盛證券研究所已于2022年12月5日發布的報告《AIGC的里程碑——Chat GPT憑什么引爆科技圈?》,具體內容請詳見相關報告。
宋嘉吉 S0680519010002 songjiaji@gszq.com
本資料不構成對具體證券在具體價位、具體時點、具體市場表現的判斷或投資建議,不能夠等同于指導具體投資的操作性意見,普通的個人投資者若使用本資料,有可能會因缺乏解讀服務而對報告中的關鍵假設、評級、目標價等內容產生理解上的歧義,進而造成投資損失。因此個人投資者還須尋求專業投資顧問的指導。本資料僅供參考之用,接收人不應單純依靠本資料的信息而取代自身的獨立判斷,應自主作出投資決策并自行承擔投資風險。
吉時通信
個人專欄
閱讀更多
金色早8點
金色財經
去中心化金融社區
CertiK中文社區
虎嗅科技
區塊律動BlockBeats
念青
深潮TechFlow
Odaily星球日報
騰訊研究院
對于 BAYC 及其衍生系列 NFT 和 APE 代幣的持有者來說,APE 質押是近期最值得關注的大事,對于 NFT 行業后續發展也有借鑒性意義.
1900/1/1 0:00:00作者:Vitalik Buterin原文鏈接:https://hackmd.io/@vbuterin/proof_of_solvency每當一個大型中心化交易所崩潰時.
1900/1/1 0:00:00原文作者:1kx 研究分析師 Justin McAfee 編譯:DeFi 之道 數字時尚使無限的自我表達不受物理限制,從數字物理(digiphysical)產品到完全沉浸式的虛擬內容.
1900/1/1 0:00:00備受矚目的古典音樂NFT平臺KOLO.Market自強勢殺入市場以來,受到廣大古典音樂愛好者以及幣圈玩家的熱捧.
1900/1/1 0:00:00FTX事件堪稱加密世界的“雷曼時刻”。事件的發展速度和影響范圍已經遠遠超出了此前的想象。不論是從傳統的中心化交易所(CEX),還是各類投資基金,均受到了此次FTX事件的連續暴擊,危機已經開始蔓延.
1900/1/1 0:00:00最近由 FTX 暴雷引發的加密市場崩潰揭示了 Web3 項目商業模式和代幣設計的脆弱性。本文不會就某個失敗項目展開具體分析,而是關注 Web3 代幣經濟在下一個采用周期中變得足夠成熟的必要條件.
1900/1/1 0:00:00