背景介紹
我叫小明,是一個每天喜歡胡思亂想的打工人。
隨著年輕人的創業熱潮的到來,我有一種創業的沖動。經過長時間的探索,我現在萌生出了一個極具創造性的點子,如果以此為依據進行創業的話一定會引起熱潮。
首先,為了確定我的想法是不是獨一無二的,我必須先通過搜索引擎進行查詢。這里有一個我很在意的問題——我在搜索引擎里搜索了我的創意,瀏覽器會將我的創意直接發送給搜索引擎的服務器,如果我的創意確實是獨一無二的,那這樣直白的搜索方式一定會把我的創業完全暴露出來,這對我來說非常致命,我絕對不能讓任何人有竊取我創意的可能。
如何才能保證在不讓搜索引擎知道我具體要查詢什么東西的情況下獲得我想要的數據是我亟待解決的難題。
麥當娜“創造之母”NFT已募集309 ETH,將捐給三家婦女兒童慈善機構:金色財經報道,據社交媒體用戶 @Darthmadonna 透露,美國歌手麥當娜與知名 NFT 藝術家 Beeple 合作推出的 NFT 系列“創造之母”(Mother of Creation )已募集 309 ETH,約合625,592.50 美元。籌集的資金將用于 3 個慈善機構,即兒童之聲基金會、歡樂之城基金會和黑人媽媽救助計劃。創造之母是三個 NFT 的集合,分別是:自然之母、進化之母和技術之母,該系列中最昂貴的 NFT 是自然之母(Nature of Nature),售價達到 170.5 ETH。[2022/10/27 11:46:32]
簡單做法
我的第一個主意是將搜索引擎中所有的數據全部下載下來,將原來的在線查詢轉換成為本地查詢。這就意味著我不用將我的點子發送給服務器端,我就可以充分地保護好自己的隱私了。
圓明園首發“創世徽章”“并蒂圓明”兩款數字藏品:金色財經報道,圓明園在“星原數藝”平臺首發“創世徽章”“并蒂圓明”兩款官方數字藏品。“創世徽章”靈感來自宮廷令牌,其中正面為星河照耀的圓明園大水法,圓明之上,以新月合葉翻蓋為冠冕,月牙翻開為壯美群山,合為鳳凰翎羽。“并蒂圓明”的設計靈感源自圓明園盛開的并蒂蓮,并蒂蓮一莖兩花,象征同心、同根、同福、同生。在七夕節推出,有著格外吉祥美好的寓意。(北京日報)[2022/8/5 12:05:15]
不過我還得考慮到另外一個問題,搜索引擎的服務器可是有pb級別的數據量,我下載下來就得花費我幾天的時間,另外我還得專門再去買幾塊大容量的硬盤,這對我來說實在是太過于昂貴。
分?桶
我換了一個想法,既然沒機會直接把搜索引擎的數據庫都給扒下來,我就試著扒下來一部分數據,然后我再本地查詢,這樣對我來說,準備的硬盤也可以少一點。
大連“創新特區”:重點引進區塊鏈等項目:8月18日消息,大連自貿片區今日發布并實施《中國(遼寧)自由貿易試驗區大連片區(大連保稅區)產業創新特區建設方案》,用高水平制度創新推動“產業創新特區”建設。《方案》指出,大連自貿片區將圍繞4個產業園區,重點培育創新創業型企業,促進創新成果產業化,提高創新鏈整體效能,其中數字信息產業園將重點引進云計算、大數據、區塊鏈等項目。(大連發布官方微信公眾號)[2021/8/18 22:22:36]
比如說,我本來想要查詢的數據是“小明是大帥哥”,這樣無疑就向搜索引擎公司暴露我是帥哥的隱私了,那我就可以換一種方式,我就查詢“大帥哥”,這樣我收到的數據雖然有很多都是我不想要的,但是里面卻會包含“小明是大帥哥”的搜索內容。這樣,我就將全部的數據庫下載換成了部分數據庫的下載。獲取部分數據庫內容以后我就可以本地再去查詢了。
這里用到了數據“分桶”的預處理技術,用于減少次要觀察誤差的影響,是一種將多個連續值分組為較少數量的“桶”的方法。
聲音 | 新華網:深圳打造區塊鏈“創新高地”:新華網今日發布題為《深圳打造區塊鏈“創新高地”》的文章稱,推出區塊鏈電子發票,上線“深圳四部門信息情報交換平臺”,中國人民銀行貿易金融區塊鏈平臺項目平穩運行……在區塊鏈的“新賽道”上,改革開放的前沿陣地深圳正不斷深化布局、推動應用,致力成為區塊鏈全球產業鏈技術鏈的高地。[2019/11/23]
隱私性保護
分桶的做法雖然很好,但是無疑向數據庫泄露了部分隱私,比如“大帥哥”這個信息,雖然服務器沒有獲知“小明是大帥哥”這個隱私,但是無疑泄露了我對“大帥哥”相關信息比較感興趣,我不想為了保護我的具體隱私讓服務器產生其他的誤解。
我只能換一種方式,傳統的隱私查詢技術給了我一點提示。
▲?背景說明
傳統的隱私查詢技術對于數據保存結構有特殊的要求:首先數據庫得是公開的,即我可以隨時調取查看服務器里的任何數據;其次,在很多個服務器上都得部署完全相同的數據庫;再者,這些部署了數據庫的服務器互相之間不能溝通;最后,假設數據庫擁有n個數據X?、X?…?Xn,那么在數據庫中其存儲形式為一個n維向量。
人物 | 迅雷CEO陳磊憑“迅雷鏈“獲中國雙創領袖峰會“創業貢獻獎”:近日,“2018年首屆中國雙創領袖峰會”在福建廈門舉行,迅雷集團CEO、網心科技CEO陳磊憑借其個人、迅雷及網心科技對于創新企業的扶持和貢獻,榮獲“創業貢獻獎”。據了解,陳磊于2014年加入迅雷,并創立專注共享計算和區塊鏈的團隊網心科技,網心科技將主要發展方向轉移至區塊鏈底層技術,并于2018年4月,推出了擁有百萬TPS,秒級出塊能力的區塊鏈主鏈“迅雷鏈”。 此前陳磊有關區塊鏈發出“不要把區塊鏈放在實驗室里,而是應用到實際當中”、“區塊鏈給了中國一個超越美國的機會”等的思考,他表示,每一位踏踏實實做事的區塊鏈人,都不應該被辜負。[2018/10/15]
▲?簡單技術方案
如果我現在需要的是數據Xi,那么其實我應該做的事情很簡單,就是自己生成一個n維向量,只在第i個位置放1,其余的所有位置都放0,很明顯的,這個時候我生成的這個向量和數據庫里的向量內積就可以獲得結果Xi。
但是這樣會存在一個問題,我如果直接將我的向量發送給服務器,他們明顯就知道我需要的是什么數據了,那我只能通過另外一種方式來保護我的隱私,將我的向量拆分。如果我把我生成的向量記為r,假設有k個服務器,注意這里k≥2,那么我只用將r拆分成為k個向量即可。更具體的,我可以拆分為:
然后將每個分量ri發送給一個服務器。然后服務器自己本地求內積,將結果發送給我,我收到k個結果后求異或就可以復原出Xi的值了。
通過算法描述,相信大家也能理解為什么服務器一定需要大于兩個,而且這些服務器之間還不能互相溝通。如果服務器之間互相可以溝通的話就可以復原出我的查詢r了。
這個算法有一個很致命的問題,就是我生成的查詢r其實是和服務器的數據大小一樣大的,如果服務器有幾千億的數據,我的r就得有幾千億維,并沒有降低網絡消耗,而且更糟糕是,我得生成很多份分量,而每個分量的大小都和數據庫一樣大,這種方式無疑比直接下載數據更加龐大。
▲?優化技術方案
因為巨大的傳輸量,我們現在可以對服務器的數據保存方式進行改進,原先的保存方式為向量,現在可以改進為矩陣,假設數據庫有25個數據,那么數據將會變成如下形式
我們此時生成的向量就可以從原來的25維縮減到5維,例如我們需要的數據是,在矩陣的第一行,那我們就可以生成查詢,此時服務器內積后會將第一行返回給我們。
同之前的方案,我們不能直接將查詢r發送給服務器,還是需要進行拆分,然后發送給服務器。同樣的流程過后我們就能第一行元素。這樣對每個服務器我們上傳的數據量為一個5維向量,下載量也同樣是一個五維向量,同時,對于每個服務器來說,他們并不知道我們最后拿到的是哪一行。
這個方案的數據總傳輸量為2k√n,這里的n為服務器擁有的總數據量,k為服務器個數,通常,只需要兩個服務器就能達到安全性的要求,故總傳輸量4√n。
在數據量大于16的情況下,這個策略的數據傳輸量已經小于直接傳輸整個數據庫的數據量了。
▲?再進階做法
我按照之前的想法在搜索引擎里查詢了一下我的創意,發現里面并沒有相關內容。我正準備慶幸沒有別人做了和我相同的事情的時候,我的朋友張三麻子和我說我用的搜索引擎查詢的結果可能不會很準,推薦了一個相關的收費網站給我,這個網站可以查詢到全球所有公司以及其具體業務模式。不過他們是按照查詢條數收費的,故不可能像搜索引擎那樣隨便讓我下載資源了。這個時候我的查詢數據需要隱私,同時他們的數據庫內容也需要隱私。
這個時候可以對之前的算法進行進一步升級,將服務器從2個擴展為4個,我同時發起行查詢和列查詢。比如我需要的數據,在矩陣里的第一行第三列,那么我就會進行第一行與第三列的查詢。行列查詢都分別拆分兩個分片,這樣總共有4種組合可能,四個服務器分別選取其中一種組合本地進行計算。這樣服務器便只會發送混淆后的一個元素回來,不會暴露自己的任何額外信息。
討論及總結
以上的算法有一個很關鍵的問題,即我知道我需要的數據是數據庫中的第幾個元素,但是通常情況下,這樣的查詢方式是不現實的。更為普遍的查詢方式為k-v查詢,即我依據某個k去數據庫查詢其對應的v。
例如,我去搜索引擎里搜索“我是大帥哥”,此時k就是“我是大帥哥”,百度返回的搜索結果就是其對應的v。如何將傳統的隱私查詢技術進行升級以配適現實生活中的實際場景仍需要進一步的探索。
數據安全是現在從個人到國家都非常重視的領域,如何將我們的隱私數據安全的使用起來也是我們一直以來努力的方向。
作者簡介
劉毅恒
來自趣鏈科技數據網格實驗室BitXMesh團隊,一個鮮為人知的程序員
Tags:區塊鏈NFTETHCEO區塊鏈的未來發展前景怎么樣nft幣發行量萬億有升值空間男生突然把網名改成EtherealCEODOGE幣
據報道,花旗銀行正在考慮向其客戶提供加密貨幣相關的服務,以應對不斷增長的需求,特別是來自資產管理公司和對沖基金的需求.
1900/1/1 0:00:00來源:21財經 作者:邊萬莉 北京第二輪數字人民幣紅包將至。據北京市地方金融監督管理局消息,北京將開啟“京彩奮斗者數字嘉年華”活動,由北京城市副中心、東城區、朝陽區、海淀區、石景山區、延慶區共同.
1900/1/1 0:00:00有網友針對特斯拉CEO埃隆·馬斯克稍早的推文提問稱,“為什么不從頭開始創建一種加密貨幣,可以滿足你所有技術需求,并獲得大量開發支持,并且至少在最初沒有高度的所有權集中問題.
1900/1/1 0:00:00有很多關于美元失去世界儲備貨幣地位的討論。大多數人仍然想知道這將在什么時候發生時,我在這里給你帶來一個令人震驚的事實:它已經在我們面前發生了,但大多數人沒有意識到這一點,因為他們不了解這些跡象.
1900/1/1 0:00:00https://shiden.plasmnet.io今天,我們很高興的跟大家介紹我們新提出的核心功能X-VM.
1900/1/1 0:00:00據Cointelegraph消息,此次邁阿密比特幣2021會議將是加密貨幣歷史上最大的比特幣活動,組織者預計與會人數將超過50,000人.
1900/1/1 0:00:00