前言:隱私計算賽道作為當下的風口賽道,無數企業紛紛涌入,搶跑占道。作為一家專注于區塊鏈隱私計算賽道科普入門的垂直媒體,同時也是針對隱私計算興趣者開放的“純天然”、低門檻入口,我們匯總并分類了隱私計算行業內晦澀難懂的名詞,編寫了「隱私計算詞典」板塊,幫助大家理解、學習。?
此篇,我們來了解隱私計算技術架構的第三部分——聯邦學習。
近年來,從無人駕駛汽車,到AlphaGo擊敗頂尖的真人圍棋手等等,AI人工智能在科技領域的發展著實吸引了足夠多人的眼球。
然而,發展至今的AI人工智能仍面臨兩大現實問題:
行業數據分散且收集困難,數據以孤島的形式存在;隱私得不到保障,安全共享數據成為了一道壁壘。針對此,人們提出了一種名為「聯邦學習」的隱私計算技術。
北京大學研究員肖臻:當前隱私計算方案普遍計算效率較低:金色財經現場報道,10月22日,2021云棲大會-螞蟻鏈“區塊鏈+”可信鏈接技術發展與實踐分論壇在杭州舉行。北京大學研究員、博士生導師肖臻以《區塊鏈+隱私計算融合技術趨勢》為題進行分享。他指出,隱私計算的目標是數據所有權和數據使用權的分離,前景十分宏偉。但現在,隱私計算的發展仍處于早起階段,并沒有實現通用。其涵蓋了聯邦學習、安全多方計算、同態加密、零知識證明、TEE可信執行環境等技術。
肖臻指出,當前隱私計算方案普遍計算效率較低,零知識證明驗證效率低,同態加密消耗資源多,查分隱私降低模型精度。而TEE的新人員與硬件廠商高度綁定,影響可信度,同時存在側信道攻擊的可能性,存在安全隱患。
肖臻介紹,區塊鏈領域中應用最多的零知識證明是zk-SNARK技術。Zcash是zk-SNARK的第一個廣泛的應用,Filecoin利用zk-SNARK完成了復制證明和時空證明。[2021/10/22 20:49:21]
聯邦學習,又名聯邦機器學習、聯合學習。它是AI人工智能的一門分支技術,旨在保障大數據交換時的信息安全、數據保護,在合法合規的前提下,有效幫助多行業的數據進行機器學習建模。
微眾銀行多方大數據隱私計算平臺通過信通院權威評測:6月24日,由中國信通院主辦的“2021大數據產業峰會-成果發布會”在北京召開。會議發布了最新一批“中國信通院大數據產品能力評測”結果。微眾銀行多方大數據隱私計算平臺WeDPR-PPC首批通過 “區塊鏈輔助的隱私計算產品”權威評測。
“中國信通院大數據產品能力評測”是國內首個面向大數據產品的權威評測體系,經過7年發展,已成為大數據領域技術研發和行業發展的風向標,為用戶選擇大數據產品提供有力支持。[2021/6/28 0:11:31]
隱私保護是聯邦學習最主要的關注點,在實際的應用中,聯邦學習通過將數據的不同特征在加密的狀態下加以聚合,以增強機器學習模型能力,再通過共享數據模型,避開原始數據共享,進而保證了數據的安全性。?
螞蟻鏈隱私計算平臺通過信通院全項測評:金色財經報道,中國信息通信研究院大數據產品評測再度更新,根據中國信息通信研究院日前公布的評測結果,共計49家企業的106款產品通過了評審,其中,螞蟻鏈數據隱私服務是本輪唯一通過全項能力測評的平臺。為進一步完善數據所有權問題、數據共享、智能合約技術、協同計算等,信通院還同時牽頭成立了“隱私計算聯盟”。
據信通院透露,螞蟻鏈數據隱私服務是本輪唯一通過全項能力測評的平臺,也成為信通院“隱私計算聯盟”的首批成員之一。
據悉,由螞蟻鏈研發的數據隱私服務,集成了基于區塊鏈的數字身份及授權體系,支持對數據隱私計算步驟、多方協作邏輯進行可信編程,降低隱私計算技術門檻,增強隱私計算協作治理、可信審計的技術能力,提供面向隱私信息全生命周期保護的技術能力。[2020/12/21 15:58:23]
利用聯邦學習的特點,即使是不導出企業數據的情況下,也能為三方或多方建立機器學習模型,既充分保護了數據隱私和數據安全,又為客戶提供個性化、有針對性的服務,實現了互惠互利。?
數字資產研究院副院長孟巖:區塊鏈與隱私計算必將走上前臺:金色財經現場報道,7月5日,由巴比特×算力智庫聯合主辦的《隱私計算:讓數據安全有序流動起來》主題會議上,數字資產研究院副院長、通證思維實驗室發起人孟巖做了主題為《數據資產化時代的區塊鏈治理》的演講。孟巖表示,目前互聯網平臺以“免費試用產品”為價格,買斷用戶的數據生產要素支配權。
要解決這一難題,必須要讓數據要素配置市場化,讓數據價值交易起來,而不是被買斷支配,在這方面區塊鏈與隱私計算必將走上前臺。[2020/7/5]
同時,我們可以利用不同類別的聯邦學習技術來解決數據異質性問題,突破傳統AI技術的局限性。依照參與建模的數據源分布,聯邦學習可分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習三類。?
橫向聯邦學習假設收集兩個數據集,這兩個數據集用戶特征重疊多,而用戶重疊少。我們把數據集按照用戶維度切分,取出雙方用戶特征相同,而用戶不完全相同的部分數據作為機器的訓練數據,這種模型稱為橫向聯邦學習。?
例如,兩個不同行政區的銀行,用戶群體分別來自所在行政區,重疊部分少。但是同作為銀行,業務類似,因此數據集收集的用戶特征則大體相同。因此,橫向聯邦學習模型收集的是兩個數據集不完全相同的用戶部分。?
如下圖所示:?
縱向聯邦學習與橫向聯邦學習相反,在兩個數據集用戶重疊多、用戶特征重疊少的情況下,縱向聯邦學習把數據集按照數據特征維度切分,取出雙方用戶相同,而用戶特征不完全相同的部分作為機器訓練數據。?
例如,同一個行政區的銀行和商超,其收集的數據用戶群體大致類似,但銀行和商超收集到的用戶特征基本不同。因此,縱向聯邦學習模型收集的是兩個數據集不完全相同的用戶特征部分。?
如下圖所示:
聯邦遷移學習在用于機器學習的數據集樣本用戶與用戶特征重疊都較少的情況下,通常不對數據進行切分,而是引入聯邦遷移學習,來解決數據不足的問題,從而提升模型的效果。
具體地,可以擴展已有的機器學習方法,使之具有橫向聯邦學習或者縱向聯邦學習的能力。?例如,收集一家位于北京的銀行和一家位于上海的商超的數據,由于受到地域限制,用戶群體交集很小;同時,由于銀行和商超類型的不同,二者收集的數據特征也基本無重合。?
引入聯邦遷移學習,首先可以先讓兩個數據集訓練各自的模型,之后通過加密模型數據,避免在傳輸中泄露隱私。之后,對這些模型進行聯合訓練,最后得出最優的模型,再返回給各個企業。?
如下圖所示:?
多種類別的聯邦學習方式使得機器學習模型更加具有通用性,可以在不同數據結構、不同行業間發揮作用,沒有領域和算法限制,同時具有模型質量無損、保護隱私、確保數據安全的優勢。?
在實際的應用中,類似銷售、金融等行業,由于知識產權、隱私保護和數據安全等因素限制,數據壁壘很難打通。
聯邦學習成為了解決這些問題的關鍵,在不影響數據隱私和安全的情況下,對來自多方的數據進行統一的建模,進行機器學習模型的訓練,這些企業之間就能更好地進行數據協作。?
可以說,聯邦學習為構建跨行業、跨地域的大數據和人工智能生態圈提供了良好的技術支持。?考慮到在整個訓練過程中,進行模型更新的通信仍然可以向第三方或中央服務器顯示敏感信息,因此聯邦學習技術廣泛地與安全多方計算、TEE或者區塊鏈等技術結合應用,來增強聯邦學習的隱私性和去信任。
但目前已有的方法通常以降低模型性能或系統效率為代價提供隱私,因此,如何在理論和經驗上理解和平衡這些權衡,將是實現聯邦學習技術廣泛應用落地的一個相當大的挑戰。
來源:CoinDesk 作者:DavidZ.Morris 翻譯:北辰 2008年,一家公司決定挖一條從芝加哥到紐約的隧道,最終耗資3億美元.
1900/1/1 0:00:00原標題:《在元宇宙里買Gucci和迪奧,軟銀押注這家亞洲公司》據華爾街日報報道,韓國元宇宙平臺Zepeto已經獲得了日本軟銀集團1.5億美元的投資.
1900/1/1 0:00:00Bytom:各位好!我們很高興在這里見面。Sonya是一位NFT藝術家、創作者和插畫家,她被邀請參加本期活動討論加密和她激動人心的NFT之旅,和你需要知道的關于如何成為一個NFT藝術家的任何事情.
1900/1/1 0:00:00注:原文作者是LayerZeroLabs首席技術官RyanZarick以及總工程師IsaacZhang.
1900/1/1 0:00:00?鏈集市?·讓區塊鏈落地更簡單 《區塊鏈行業觀察》專欄·第63?篇 作者丨CloudPay 圖片丨來源于網絡 在過去的幾年里,您可能已經聽說了很多關于區塊鏈的信息.
1900/1/1 0:00:00原標題:《探秘數字身份》作者:德鼎創新基金合伙人王岳華,RichardWang,GeneralPartnerofDraperDragonFund在NUCBBusinessschool的發言.
1900/1/1 0:00:00