數據要素市場在整體架構上將是分布式的,但會有一些「數據中介機構」作為核心節點,區塊鏈可作為數據要素市場的組織工具。
原文標題:《鄒傳偉:區塊鏈在數據要素市場中的應用|萬向區塊鏈「融合創新」系列行研報告》撰文:鄒傳偉,萬向區塊鏈首席經濟學家
本文為萬向區塊鏈「融合創新」系列行業研究文章,作者為萬向區塊鏈首席經濟學家鄒傳偉博士。本文采取「化整為零」方法,先將數據價值鏈分為數據記錄和獲取,數據收集、驗證和存儲,數據分析,以及數據要素配置等4個環節,再依次討論區塊鏈在這些環節能發揮的作用。
區塊鏈和數據要素市場是當前兩個備受關注的領域。今年4月,中共中央和國務院《關于構建更加完善的要素市場化配置體制機制的意見》首次將數據列為要素之一,國家發改委在對「新基建」的界定中將區塊鏈定位于新技術基礎設施。很多專業和學者討論了區塊鏈在數據要素市場中的應用,高度肯定這方面應用對保護和使用個人數據以及為AI發展完善數據基礎的重要意義。但與區塊鏈在央行數字貨幣、穩定幣、供應鏈金融、存證和防偽溯源等領域的應用不同,數據要素市場本身處于發展早期,在很多核心問題上尚無定論,這使得關于區塊鏈在數據要素市場中的應用的討論很難深入。
本文在之前研究的基礎上,討論區塊鏈在數據價值鏈的不同環節能發揮的作用。根據全球移動通信系統協會2018年報告,數據價值鏈主要可分為4個環節:一是數據生成,指數據記錄和獲取。二是數據收集、驗證和存儲。三是數據分析,指處理和分析數據以產生新的洞見和知識。四是交換,指對數據分析結果的使用,既可以是內部用,也可以對外轉讓,這個環節稱為「數據要素配置」更合適。本文共分5部分,前4部分依次按上述4個環節展開,重點是對第4個環節的討論,第5部分總結全文。
圖1:數據價值的主要環節
區塊鏈在數據記錄和獲取中的應用
區塊鏈是關于Token的分布式賬本,Token本質上是區塊鏈內定義的狀態變量。區塊鏈內既存在與Token及其交易有關的數據,也存在與Token及其交易無關的數據。
與Token及其交易有關的數據——區塊鏈各地址內有多少Token以及不同地址之間的Token交易記錄——原生于區塊鏈并被區塊鏈記錄下來,是數學規則的產物,真實準確性由密碼學、共識算法等保證。從占用區塊鏈內存儲空間的比例以及驗證節點投入的計算資源來衡量,這部分數據在區塊鏈內數據中居于主導地位,也是區塊鏈內「價值含量」最高的數據。比如,在央行數字貨幣和穩定幣等應用中,這部分數據是分析資金流動和實施反洗錢、反恐怖融資等監管的基礎。再比如,在加密貨幣定價中,鏈內交易數據是重要的估值參考。
鄒傳偉:數字人民幣在核心系統沒有使用區塊鏈技術:近日,萬向區塊鏈首席經濟學家鄒傳偉在澎湃新聞的問吧欄目中表示,數字人民幣作為人民幣現金的“升級”版,會在一定程度上替代人民幣現金,但不會完全取代。中國人民銀行將繼續發行和管理人民幣現金,因為人民幣現金的持有和使用是真正的“零門檻”,不需要依靠智能手機。數字人民幣在核心系統沒有使用區塊鏈技術,但吸收了區塊鏈技術的關鍵特征。[2020/10/19]
與Token及其交易無關的數據作為Token交易的附加被寫入區塊鏈內。寫入區塊鏈意味著全網可見,不可篡改,并且在復制、傳播中不會出錯,但區塊鏈本身不能保證這些數據在源頭和寫入環節的真實準確性。因為區塊鏈內存儲容量的限制,這部分數據在很多時候只能以哈希摘要形式寫入區塊鏈,只有少量結構化信息才能以原始數據形式上鏈。因此,在現實世界無時無刻不在產生的瀚如煙海的數據中,能以原始數據形式上鏈的比例幾乎可以忽略。這說明,區塊鏈不是一個有一般用途的賬本或數據庫,應該用其所長,只有價值足夠高的數據才值得以原始數據形式上鏈。
哈希摘要上鏈主要作用是存證,為存放在本地設備或云端上的原始數據增信——在事后通過揭示原始數據,證明兩點:一是在區塊鏈記錄的上傳時點,原始數據確實存在;二是上傳者確實知道原始數據。但不宜拔高理解區塊鏈的存證和為數據增信的作用。特別是,對并非原生于區塊鏈的數據,其可信度離不開專門的數據記錄和獲取技術以及相關制度的支持,比如接下來將討論的「區塊鏈物聯網」對物聯網數據的管理。
物聯網設備不斷從周邊獲取地理位置、溫濕度、速度和高度等數據。在目前的端側抗攻擊技術下,物聯網數據在源頭的真實準確性有相當程度的保障。物聯網數據主要存放在云上和物聯網設備本地。大部分物聯網能夠運行哈希算法和公私鑰簽名運算。在物聯網數據上鏈中,只有少量結構化數據可以直接寫入區塊鏈,大部分數據是以哈希摘要的形式上鏈。因此,在「區塊鏈物聯網」對物聯網數據的管理中,相關操作均由物聯網設備自動執行,效率非常高,也減少了人為干預。
「區塊鏈物聯網」為理解區塊鏈在數據記錄和獲取中的應用提供了基準。在物聯網數據以外,很多數據在記錄和獲取中受人為因素影響很大,是否值得上鏈,需要算成本和收益的細賬。
區塊鏈在數據收集、驗證和存儲中的應用
數據收集、驗證和存儲主要靠數據庫技術,區塊鏈能直接發揮的作用有限。比如,金融領域對個人數據的管理,現在普遍強調API技術的應用,通過數據聚合產生復合價值。
鄒傳偉:DC/EP跨境支付需研究兩個問題:9月1日消息,近日,河北省政府印發《中國(雄安新區)跨境電子商務綜合試驗區建設實施方案》。雄安新區探索數字貨幣跨境支付,萬向區塊鏈首席經濟學家鄒傳偉表示,DC/EP跨境支付還需研究兩個問題:第一,在完善KYC程序和要求前提下,提高境外居民和機構開立DC/EP錢包的便利性;第二,如果境外居民和機構對DC/EP的需求很高,人民銀行要與所在國家的中央銀行合作,以尊重對方的貨幣主權。DC/EP應以開放友好的方式走向世界。(第一財經)[2020/9/1]
如第一部分討論的,區塊鏈能存儲的數據非常有限。絕大部分數據存放在本地設備或云端上,但可以通過哈希摘要上鏈來增信。另外,如果數據收集、驗證和存儲通過由不同機構組成的市場分工網絡進行,那么理論上,這個市場分工網絡可以構建在區塊鏈上。分布式存儲項目Filecoin可以視為這個方向的嘗試。這個方向要取得大范圍成功,需要做好分布式經濟體的機制設計。我把相關的經濟學問題概括為分布式數據經濟體,將在第4部分討論。
區塊鏈在數據分析中的應用
區塊鏈在數據分析中能直接發揮的作用也非常有限。因為區塊鏈內計算性能的限制,復雜的數據分析工作一般不通過區塊鏈內智能合約進行,而主要靠統計學、計量經濟學、數據可視化、大數據分析和AI等技術,相關計算發生在區塊鏈外。
如果數據分析也通過不同機構組成的市場分工網絡進行,那么理論上,也可以引入基于區塊鏈的分布式數據經濟體。比如,PlatON項目致力于建設一個高性能的計算網絡,以促進數據和算力的流通,主要的市場參與者包括計算協調方、數據提供方和算力提供方等。
區塊鏈在數據要素配置中的應用
區塊鏈作為一項帶有生產關系色彩的集成型技術,在數據要素市場中的應用將主要體現在數據要素配置環節。接下來將從數據要素確權和數據要素市場的組織形式兩個層次討論這一問題。
數據要素確權
經濟學研究表明,任何資源有效配置的前提都是確定資源的產權,數據要素也不例外。產權是一個復雜的經濟學概念,指一種可執行的社會架構,該架構決定資源如何被使用或擁有的。產權有三個核心維度:第一,使用資源的權利;第二,從資源中獲得收益的權利;第三,將資源轉移給他人,改變資源,放棄資源,以及損毀資源的權利。產權可以細分為所有權、占有權、支配權、使用權、收益權和處置權等「權利束」。
鄒傳偉:央行數字貨幣或可實現與第三方支付雙贏:6月12日,在由《中國經營報》和微吼聯合舉辦的“2020財富公開課”上,萬向區塊鏈首席經濟學家鄒傳偉表示,如果第三方支付機構可以作為DC/EP托管和支付機構,第三方支付行業目前對各種應用場景的滲透,以及建立的二維碼等收單系統,可以在DC/EP應用推廣中發揮積極作用,從而實現雙贏局面。(中國經營網)[2020/6/15]
數據兼有商品和服務的特點,很多數據是非排他性的和非競爭性的,數據的所有權不管在法律上還是在實踐中都是一個復雜問題,特別對個人數據。現實中,能清晰界定所有權的數據的典型代表是專利,但從專利更能看出數據確權的復雜性。
取得專利權的前提是公開發明的技術內容,以便大眾作進一步改良,避免重復研發的資源浪費。比如,專利審理機關一般會在發明專利申請后約18個月將專利說明書內容公開。專利權人在法定期間內享有專利技術的排他權,享有商業上的特權利益。這是為保護發明人的權利,鼓勵大眾從事發明。當專利權法定期間屆滿時,專利權即告消滅,民眾可根據專利說明書所揭露的內容,自由運用其專利技術。
從全球實踐看,數據要素確權是法律和技術共同作用下的產物,一般先由法律確定數據產權的制度框架,再由技術來保證這些制度框架的可執行性。比如,現在很多報刊雜志是付費的,只有付費賬戶才能閱讀文章,并通過技術來限制對文章的復制和截屏,如果發現有人抄襲就通過法律來維護權益。在很多場合,只靠技術是沒法對數據要素確權。第一部分討論了區塊鏈的存證作用。數據存證不等于數據確權。比如,發明人可以把發明文件的哈希摘要放到區塊鏈上,證明自己最早做出相關發明,將來出現糾紛時有「自證清白」功能。但如果不經過專利審查機關的核準,發明文件上鏈不意味著專利權。
一些專家和學者認為,只有所有權清晰的數據才能進入數據要素市場。這是很大的誤解。「所有權清晰買斷式交易」模式只適合像專利這樣的特殊類型數據,但不會成為數據要素市場的主流。在實踐中,數據要素市場成立的前提是對數據的有效控制,也就是控制誰能在何種條件下以何種方式使用數據。換言之,數據產權歸根結底體現為對數據的有效控制。這個角度有助于理解區塊鏈在數據要素確權中的作用。
在區塊鏈內,地址能隱藏實際控制者的身份,哈希摘要能隱藏原始數據,但區塊鏈本身不是隱私管理技術。特別是,公鏈內數據是全網可見的,需要配合環簽名、混幣和合幣等技術才能隱藏鏈內資金流向。聯盟鏈可以實現對數據的有差異開放,讓不同用戶在讀取區塊鏈內數據上有不同權限。但正如第一部分討論的,區塊鏈內存儲的數據畢竟有限,區塊鏈在數據控制上的直接作用也是有限的。比如,「區塊鏈政務數據共享」類項目中,政務數據存放在本地設備上,跨政府部門的數據調用仍通過傳統方法進行,原始數據不可能在區塊鏈上流通,但區塊鏈會記錄數據申請、授權、調用和訪問等記錄,做到不可抵賴,主要為事后審計留痕。
萬向區塊鏈鄒傳偉:第三方支付可在數字貨幣應用推廣中發揮作用:萬向區塊鏈、PlatON首席經濟學家鄒傳偉表示,數字貨幣中,人民銀行在做好技術標準和應用規范的基礎上,支付路徑、支付條件以及之上的商業應用會交給市場來做。盡管從支付清算基礎設施的角度看,數字貨幣與第三方支付不一樣,但第三方支付目前對各種應用場景的滲透以及建立的收單系統,可以在數字貨幣的應用推廣中發揮積極作用。(21世紀經濟報道)[2020/4/22]
在各種數據控制技術中,與區塊鏈關系最大的是密碼學技術,包括可驗證計算、同態加密和安全多方計算等。對復雜的計算任務,可驗證計算會生成一個簡短證明。只要驗證這個簡短證明,就能判斷計算任務是否被準確執行,不需要重復執行計算任務。在同態加密和安全多方計算下,對外提供數據時,采取密文而非明文形式。這些密碼學技術使得「數據可用不可見」,但因為對計算資源的要求很高,只能在區塊鏈外進行。
在各種數據控制技術中,與區塊鏈最容易混淆的是支付標記化,在此也做簡單說明。支付標記化的英文是Tokenization,指用特定的支付標記替代銀行卡號和非銀行支付機構支付賬戶等支付要素,并對標記的應用范圍加以限定,降低在商戶和受理機構側發生銀行賬戶和支付賬戶信息泄露的風險,減少交易欺詐,保障用戶交易安全。支付標記與銀行賬戶、支付賬戶之間有映射關系,這個映射關系由標記服務提供方通過支付標記化和去標記化兩個過程來管理。支付標記化是數字支付的基礎核心要素。比如,在移動支付中,用戶使用Token號作為存儲在手機等移動設備中的設備卡號,可以在線下POS機、ATM機等終端機上用移動設備做非接觸式近場支付,也可以在手機客戶端中直接發起遠程支付。
目前,銀聯手機閃付和在線支付產品已全面應用支付標記化技術。從以上介紹可以看出,支付標記化中的Token是代表銀行賬戶和支付賬戶等敏感信息,有規范的編制標準,不依賴于復雜的密碼學技術;區塊鏈內的Token在央行數字貨幣和穩定幣等應用中代表法定貨幣儲備資產,但Token本身是區塊鏈技術的產物。
數據要素市場的組織形式
數據要素因為類型和特征多樣,缺乏客觀的估值標準,并且在很多場合不會采取買斷式交易模式,所以數據要素市場不會像股票市場那樣,成為一個集中化、流動性好的交易市場。這從過去幾年多省市對大數據交易中心或大數據交易所的試驗中可以得到驗證。這些試驗都沒有取得預期的成功。這盡管有政策支持力度不夠和配套技術跟不上等原因,但更重要的原因則是:數據要素的經濟學屬性不支持標準化程度高、競價撮合和成交活躍的交易模式。
萬向區塊鏈鄒傳偉:疫情會加速DC/EP進展:萬向區塊鏈、PlatON首席經濟學家鄒傳偉表示,疫情會加速DC/EP的進展。第一,疫情中,現鈔可能攜帶病是全社會關心的問題,人民銀行為此對疫情防控重點地區回籠的現金加強了管理。DC/EP不存在這個問題,并且DC/EP的“雙離線”支付功能更顯優勢。第二,疫情后國際局面會更復雜,DC/EP為疫情后人民幣國際化的新局面提供新思路。第三,數字貨幣可能滿足應對疫情的貨幣政策和財政政策的特殊要求,比如零利率時的貨幣政策,更積極的財政刺激政策。(21世紀經濟報道)[2020/4/22]
在大圖景上,數據要素市場將更接近債券市場和場外衍生品市場這樣的場外市場,標準化程度較低,點對點交易并協商定價,成交頻率低但會一直發生。但這不意味著最終的數據提供者和最終的數據需求者會直接進場交易。數據要素市場會演變出一些「數據中介機構」,讓數據更好地從最終的提供者流向最終的需求者。
因此,數據要素市場在整體架構上將是分布式的,但會有一些「數據中介機構」作為核心節點。對區塊鏈在數據要素市場組織形式這個環節的應用,要在這個大框架分析。
第一,「數據中介機構」的主要功能是數據收集、驗證、存儲和分析。對這些「數據中介機構」如何使用區塊鏈,第二、三部分已有分析。需要補充說明的是,區塊鏈可以用來改進數據發布環節。比如,姚前2018年在央行數字貨幣原型系統中,提出將區塊鏈應用于央行數字貨幣確權登記。他的設想是,由中央銀行和商業銀行構建央行數字貨幣分布式確權賬本,提供可供外部通過互聯網進行確權查詢的網站,實現央行數字貨幣的網上驗鈔機功能。這是利用區塊鏈不可篡改、不可偽造的特性提高確權查詢的數據和系統安全性。
第二,如前面已討論的,現實世界中大部分數據不會通過區塊鏈存儲和流轉,但區塊鏈可以記錄數據的授權、調用和訪問等活動,這類似于區塊鏈在供應鏈管理和商品溯源等場景的應用。這個應用方向有價值,但創新意義不是很強。首先,數據分析和使用會產生新數據,使得對數據流通的溯源意義不大。其次,如果要從數據保密和防泄漏的角度跟蹤追溯數據流通,分析TCP/IP數據包是比區塊鏈更直接、有效的方法。
第三,區塊鏈作為數據要素市場的組織工具,這就是前面引入的分布式數據經濟體概念:
分布式數據經濟體的基礎是數據確權,體現為數據提供者能有效控制數據需求者對數據的使用。分布式數據經濟體是一個豐富的數據生態。不同參與者在數據、算法和算力等方面互通有無。這本質上是通過市場機制進行大規模協同計算,在保護數據產權的情況下實現數據要素的有效配置,以促進經濟發展和增進社會福利。區塊鏈記錄下分布式數據經濟體中的經濟活動,但不是為了存證和溯源,而是為了對經濟活動進行核算。在分布式數據經濟體中,交易媒介采用央行數字貨幣或穩定幣。原因在于,分布式數據經濟體的一些參與者可以是非人格化的,比如物聯網設備作為數據提供者,AI算法作為數據需求者。央行數字貨幣和穩定幣能兼容分布式數據經濟體的這種開放性,并且能保障支付的安全和高效。分布式數據經濟體有很多有意思的應用場景。比如,在「區塊鏈物聯網」中,物聯網設備ID綁定數字貨幣錢包地址,物聯網中的數據存儲、傳輸和挖掘以及價值交互就能以可信方式進行,物聯網中與數據有關的經濟活動通過央行數字貨幣或穩定幣來核算。可以設想,當一個物聯網設備持續提供高質量數據后,將收獲更多央行數字貨幣或穩定幣作為「酬勞」。這種經濟激勵將顯著促進物聯網數據的收集和使用。
這個方向有助于實現肖風博士提出的分布式認知工業互聯網。分布式認知工業互聯網采取分布式的治理架構,所有企業都可以放心加入,采取基于知識圖譜的認知智能技術以及基于隱私計算的數據協同,并且基于全生命周期管理的制造和服務的融合。
小結
區塊鏈對建設數據要素市場有重要意義。但因為數據要素市場本身處于發展早期,在很多核心問題上尚無定論,這使得關于區塊鏈在數據要素市場中的應用的討論很難深入。本文采取「化整為零」方法,討論區塊鏈在數據價值鏈的不同環節能發揮的作用。
第一,數據記錄和獲取環節。區塊鏈作為關于Token的分布式賬本,不能當作一個有一般用途的數據庫來用。與Token及其交易有關的數據,原生于區塊鏈并被區塊鏈記錄下來,是區塊鏈內「價值含量」最高的數據。但在現實世界的海量數據中,能以原始數據形式上鏈的比例幾乎可以忽略,大部分數據只能以哈希摘要形式寫入區塊鏈。哈希摘要上鏈有存證和為原始數據增信的作用。「區塊鏈物聯網」對物聯網數據的管理,效率高且人為干預少,為理解區塊鏈在數據記錄和獲取環節的應用提供了基準。其他數據是否值得上鏈,則要仔細平衡成本和收益。
第二,數據收集、驗證、存儲和分析環節。區塊鏈在這些環節能直接發揮的作用有限。但如果這些環節通過由不同機構組成的市場分工網絡進行,那么就可以構建在區塊鏈上,成為分布式數據經濟體。
第三,數據確權環節。數據確權是數據要素配置的基礎。數據要素確權是法律和技術共同作用下的產物。通過區塊鏈為數據存證不等于數據確權。在實踐中,數據確權主要體現為數據提供者能有效控制數據需求者對數據的使用。在這個意義上,區塊鏈不是隱私管理技術。聯盟鏈可以做到對數據的有差異開放,讓不同用戶在讀取區塊鏈內數據上有不同權限。但區塊鏈內存儲的數據有限,區塊鏈在數據控制上的直接作用也有限。可驗證計算、同態加密和安全多方計算等密碼學技術使得「數據可用不可見」,但因為對計算資源的要求很高,只能在區塊鏈外進行。
第四,數據要素的配置環節。數據要素市場在整體架構上將是分布式的,但會有一些「數據中介機構」作為核心節點。區塊鏈不可篡改、不可偽造的特性有助于改進數據發布環節。區塊鏈可以記錄數據的授權、調用和訪問等活動,有一定價值,但創新意義有限。區塊鏈在這個環節的創新價值主要體現為分布式數據經濟體,本質上是通過市場機制進行大規模協同計算,在保護數據產權的情況下實現數據要素的有效配置。分布式數據經濟體有助于實現分布式認知工業互聯網。
附注:
GSMA,2018,"TheDataValueChain".
哈希摘要的另一個主要用途是與原像配合,在哈希時間鎖合約和離散日志合約中作為多方協調工具。可參考《哈希時間鎖應用》,https://www.chainnews.com/articles/365768981629.htm。
對Filecoin經濟學模型的分析可見《Filecoin經濟模型簡述》,https://www.chainnews.com/articles/974219932958.htm
感興趣的讀者可以參考PlatON的經濟學藍皮書:https://platon.network/pdf/zh/PlatON_Blue_Paper_on_Economics_ZH.pdf
Tokenization與加密有一定聯系,但也有很大區別,請見:https://www.mcafee.com/enterprise/en-hk/security-awareness/cloud/tokenization-vs-encryption.html
姚前,2018,《中央銀行數字貨幣原型系統實驗研究》,《軟件學報》2018年9月,總第29卷第9期。
https://www.chainnews.com/articles/636789905948.htm
本文來源于非小號媒體平臺:
鄒傳偉
現已在非小號資訊平臺發布27篇作品,
非小號開放平臺歡迎幣圈作者入駐
入駐指南:
/apply_guide/
本文網址:
/news/9558352.html
免責聲明:
1.資訊內容不構成投資建議,投資者應獨立決策并自行承擔風險
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表非小號的觀點或立場
上一篇:
幣安為何推出第三條鏈?這對BNB意味著什么?
Tags:區塊鏈數字貨幣TOKKEN區塊鏈的未來發展前景論文買數字貨幣是什么意思Financial Intelligence Group TokenRoush Fenway Racing Fan Token
2020年10月23日晚上8點,BlockArk聯合創始人Warren和OasisBDandPartnershipsLindaLu在Uniswap中文社區.
1900/1/1 0:00:00Althea是Cosmos生態系統中為數不多將物理層去中心化的項目。 撰文:小毛哥 互聯網是現代最重要的工具之一,對生活在城市里的大部分人來說,互聯網觸手可及,但是獲得高質量以及能夠負擔得起的寬.
1900/1/1 0:00:00Pass這個通行證的概念在游戲行業流行已久,卻一直如雞肋。battle與之的結合,也仍名不副實。想要通過讓玩家購買Pass,從而通過日常戰斗完成任務來獲得成就,這一初衷被無端扭曲.
1900/1/1 0:00:00知名區塊鏈投資機構Placeholder打算推出一個新指標NVTV比率,專門用于智能合約平臺估值。作者:ChrisBurniske編譯:LeftOfCenter為區塊鏈協議估值永遠是個難題.
1900/1/1 0:00:00以CryptoKitties和GodsUnchained為代表的區塊鏈游戲憑借著數字資產稀缺性,交易真實性,透明性等優勢進入了人們的視線.
1900/1/1 0:00:00Livepeer是以太坊生態中較為活躍的視頻類項目,獲得多家知名VC投資,但其經濟模型以及技術缺乏亮點.
1900/1/1 0:00:00