撰文:ZeoZhang
來源:鏈聞ChainNews
騰訊創始人馬化騰曾在2017年「邁進智能新時代」中國IT領袖峰會上坦言:
目前很多大數據是垃圾數據,因為沒有標簽,用再好的算法也算不出來,數據清洗、標簽化難度非常高,我們甚至要耗費很多人工先清洗數據,再讓AI學習。
一席話道出人工智能發展難點。在互聯網計算機迭代數十年后,算法和算力的積累已將人工智能推向一個新的階段,但缺乏高質量的有效數據,成為掣肘人工智能發展的重要原因之一。在解決這一問題上,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol提出了結合區塊鏈的解決方案。
2021年8月15日,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol將正式上線主網。作為一個首次集數據標注、分布式存儲以及數據應用等功能于一身的項目,EpiKProtocol嘗試解決市場缺乏有效數據問題,構建共建共享共益的AI數據的分布式存儲協議?
為什么缺乏有效數據?
一方面,平臺默許甚至鼓勵虛假的刷數據行為,造成無用數據橫行。
對于傳統互聯網行業來說,刷數據現象司空見慣:新開的網店九成以上會選擇刷單吸引客流量;即使是訂閱量超百萬的微信大號也經常通過刷閱讀量滿足廣告客戶的數據需求;更甚者,某旅游平臺曾被爆出通過機器+人工的形式,冒充用戶發表了數千萬的用戶評價,以假亂真,影響用戶對產品的真實測評。
Klaytn生態算法流動性市場協議Klap宣布主網上線:據官方消息,Klaytn生態算法流動性市場協議Klap Finance宣布主網上線。用戶可以使用Synapse Protocol將資產從以太坊網絡跨鏈至Klaytn、Avalanche、Arbitrum、Fantom、Harmony、Optimism等網絡。[2022/6/24 1:29:39]
對于一向標榜公開、透明、鏈上可追溯的區塊鏈行業來說,刷數據現象仍不鮮見,分布式存儲領域明星項目?Filecoin?也曾陷入「無效數據」質疑:在Filecoin網絡剛上線時,較高的挖礦收益吸引大量礦工參與,甚至有部分礦工利用外部程序進行灌裝虛擬數據或自己封裝一些毫無價值的垃圾數據。
Filecoin存儲算力快速暴增,從而導致存儲的數據量短時間爆增。再加上Filecoin網絡一開始無法對存儲的數據進行分辨,真實有效數據極少,大量物理存儲被浪費,對整個Filecoin生態發展帶來不良影響。
另一方面,數據處理成本居高不下,多數人工智能不堪重負。
眾所周知,人工智能需要不斷深度學習,這需要龐大的數據量支撐。
龐大的用戶群體每天活躍在互聯網中,產生龐雜的數據。然而這些數據并不能被直接使用。人工智能的深度學習需要數據集的獲得、數據的標注等,其中數據的標注會造成巨大的人力成本。
Aave V2版本已在主網上線:金色財經報道,Aave協議V2版本已經在主網上線。在V2版本中,被用作抵押品的資產可以進行自由的交易,新功能還包括閃電貸升級、抵押品直接還款、閃電貸清算、批量處理閃電貸、債務代幣化、本地信貸授權、Gas優化、穩定利率及浮動利率切換。Aave V2已通過了MixBytes、CertiK、ConsenSysDiligence及PeckShield的審計。[2020/12/4 23:02:37]
廣泛應用深度學習網絡需要大量已標注的數據進行訓練才有可能達到預期的效果,但大數據時代下,雖然有海量的數據取之不盡,絕大部分卻是未進行標注的數據,這些訓練數據的標注需要人為進行。
對于數據品質要求越高,數據的標注需求就越精細,對標注人員的素質和專業知識的要求也就越高,相對應成本也越高。
長久以來,這些數據都由專門的數據標簽分類公司進行加工處理,以供人工智能等數據需求領域發展使用。然而,用戶-數據處理公司-數據需求者的三方協作,使得有價值的數據獲取成本極高。
標注、存儲、銷售:EpiKProtocol的一站式數據服務
EpiKProtocol生態引入領域專家、賞金獵人、數據企業三類角色,致力于構建去中心化的大規模共建共享共益的AI數據存儲協議,通過去中心化存儲技術IPFS、去中心化自治組織DAO及通證經濟模型,組織并激勵全球社區成員將人類各領域知識梳理成可用的AI數據,并持續更新這一人類永恒知識庫。
金色科技集團研究院院長池騁:Filecoin主網上線后怎樣增加信任價值是未來所面臨的挑戰:Filecoin主網上線在即,金色科技集團研究院院長池騁在接受金色財經獨家采訪時表示,Filecoin主網上線后社區熱度肯定會有所改觀,同時我自己也會更多關注Filecoin社區中關于實際應用場景落地的討論。我認為上線后怎樣增加信任價值是未來所面臨的挑戰,作為一種全新區塊鏈底層技術我認為更多的是去探索一種跟現實應用的連接,這種連接的增加也是提高Filecoin本身信任價值的一種方式。但這就得需要我們的社區和更多的關注者去發現了。[2020/10/15]
在數據標注方面,EpiKProtocol連接C端用戶推出AI數據標注系統。
「領域專家」設計不同領域的AI數據格式,并發布數據標注任務;人人都能注冊成為「賞金獵人」,參與數據標注成為AI老師,獲得EPK代幣獎勵。
完成數據標注后,「賞金獵人」返還處理過的數據,「領域專家」驗收所負責領域AI數據獲得EPK代幣獎勵。此外,「領域專家」還會根據數據結果優化AI數據格式,良性循環下,數據質量得到不斷提升。
在數據存儲方面,EpiKProtocol推出AI數據存儲系統。
完成標注并通過驗收的數據將由「領域專家」上傳至AI數據存儲系統進行分布式存儲,參與數據存儲的設備也都可以獲得EPK代幣獎勵。
Gate.io 支持FIL(IPFS Filecoin)主網上線和將開啟FIL充值提現:據官網公告,Gate.io正在交易的FIL(IOU)六個月成熟期的Filecoin是IPFS公開對外發行的主網上線后成熟期最短的代幣。當前平臺流通量為240萬枚,自2017年以來交易三年時間,是當前全球最大的FIL(IOU)流通和交易市場。Gate.io未曾與任何挖礦服務商合作,特此公示。
另據IPFS Filecoin官方消息,Filecoin主網將在區塊鏈計時Epoch 148888啟動,大約對應現實時間為2020年10月15日。Gate.io平臺主網上線之前的FIL(IOU)代幣將會在主網上線后每日解鎖約0.55%,180天后將完全解鎖。Gate.io平臺的FIL(IOU)是目前官方對外發行的成熟期最短的FIL代幣。
Gate.io FIL充值將在主網上線后立即開放,用戶可立即充值到Gate.io參與當前全球最大FIL市場的交易,提現將第一時間開放,同時Gate.io提供FIL代幣永續合約交易,用戶可以根據自己需求做多或者做空FIL,Gate.io提醒FIL上線初期可能產生劇烈的價格漲跌,請務必留意近期市場波動。詳情點擊原文鏈接。[2020/10/4]
在數據銷售方面,數據企業可通過質押EPK來訪問數據,并從AI數據存儲系統中付費下載有效數據。
動態 | 測試期結束 Tezos主網上線:2018年9月17日Tezos基金會網站上的一篇博客文章中披露,在測試期結束后,期待已久的主網上線終于到來。[2018/9/18]
由于EpiKProtocol的AI數據標注系統直接面向C端用戶,消除了中間戶數據標注公司的存在,簡化了數據處理流轉的各個環節,因此成本更低。以一條可用的AI語音方言數據為例:傳統市場一條可用數據成本約在12元左右,而在EpiKProtocol系統成本約為2元,是傳統市場的1/6。
更重要的是,由于EpiKProtocol系統中有來自各行各業的「領域專家」把關數據治理,因此EpiKProtocol系統產生的有效數據更能夠精準符合不同AI領域的數據需求。
協同B端、C端和行業專家的開放經濟模式
不同于目前分布式存儲主要圍繞B端歸檔數據存儲服務的商業模式,EpiKProtocol是一個協同B端企業、C端用戶和領域專家的去中心化協同AI數據存儲協議,在成本控制、收益提升和服務體驗方面,都具有媲美中心化互聯網巨頭的能力。
C端用戶:更低的數據標注門檻
EpiKProtocol針對C端用戶打造了AI數據采集應用「知識大陸」,降低了數據標注門檻,同時提升了趣味性。卡通的界面和簡明的布局讓數據標注這種枯燥而繁雜的工作變為有趣的游戲,通過游戲化形式組織其全球社區成員共建大規模開放AI數據庫。
各行各業都可以在「知識大陸」中創建AI數據類型,包括金融、醫藥、法律、社交、電商等,未來隨著知識大陸的發展和運用,有數據需求的公司都可以選擇在此進行共同協作收集整理并處理數據。
其次,EpiKProtocol的標注效率更高。AI數據標注系統運營三周以來,EpiKProtocol標注了17272條有效數據,且數據指標完整,每條數據被人工驗證次數高達10次。相比較于傳統標注方式,EpiKProtocol的標注效率高了近乎10倍。
最重要的是,參與EpiKProtocol數據標注的用戶能夠獲得更高收益。傳統數據標注模式中,數據處理者僅作為一種人工勞動力,并不享有數據分紅權。而在EpiKProtocol中,對數據做出貢獻所獲得的EPK實際是獲得了數據的股權,分享數據在后續使用過程中的盈利分紅。后期數據需求越大,EPK需求就越高,EPK便會升值,EPK持有者便可以獲益。
B端用戶:激勵有效數據
EpiKProtocolAI數據存儲系統采取經典的1+3配置,即1Deamon+3Miners配置。與Filecoin相比,EpiKProtocolAI數據存儲系統參與出塊最小算力為0、存儲免費,無需指定節點且默認無限份數、無限時間,更能夠充分調度起每臺閑置存儲設備。
最重要的是,Filecoin存儲無用數據也可獲得算力,但EpiKProtocol存儲系統中只有通過「領域專家」驗證過的數據才可獲得算力,這不僅保障了數據的高質量,而且進一步遏制了無效數據浪費存儲空間的不良影響。
項目團隊
EpiKProtocol擁有行業頂級顧問以及實力派投資機構。著名AI科學家、SigularityNET創始人、全球首個機器人公民Sophia之父的首席科學家BenGoertzel出任EPIK?銘識協議顧問,協助EPIK推動歐美數據市場,助力構建高質量的AI數據生態。
融資方面,EpiKProtocol獲得了包括FBGCapital、JACKDAW、1475、ChainUpCapital、7O'clockCapital等機構的青睞,助力AI數據的分布式存儲以新的勢頭進入大眾視野。
主網即將上線
根據團隊最新消息,EpiK「主網1.0羅塞塔」將于2021年8月15日中午12點正式上線。該時間也是EpiK測試網上線1周年的時刻。目前測試網5.0在測節點已超過6萬個,穩定出塊。
隨著主網的日益臨近,挖頭礦也成為EpiKProtocol用戶的關注焦點之一。作為EpiKProtocol生態激勵代幣,EPK總發行量為10億,其具體分配規則如下:
1.創世團隊:5%,每90天釋放1/16;
2.基金會:5%,每90天釋放1/4;
3.投資人:20%,每90天釋放1/7;
4.社區:70%,出塊速遞每90天衰減一次,4年減半,分50年釋放完畢。
EpiKProtocol擁有AI數據標注和AI數據存儲兩大系統,也對應了兩種主要參與方式:
第一類,參與標注AI數據,成為EPK賞金獵人。利用閑暇時間參與標注不同AI領域數據,完成任務越多,EPK收益越高。認真答題還有機會贏取知識徽章NFT,后續可憑借NFT參與EPK空投活動。
第二類,參與存儲AI數據,成為EPK存儲節點。利用閑置的存儲設備即可參與存儲AI有效數據,每個存儲節點需要完成1000EPK的基礎質押才能擁有出塊權。存儲節點是隨機獲得出塊機會的,但是其隨機被選中的概率和其成功存儲的數據大小掛鉤:存的數據越多,被選中概率越高,同一個文件的Top100存儲者享有雙倍算力。
只有通過領域專家驗證過的數據才被計為有效存儲,存儲節點才能獲得算力,因此,為了獲取更多的有效存儲,就需要完成額外的流量抵押。1EPK可以用于訪問10Mib數據,也可用于封裝10Mib數據。目前,基礎抵押提現的解鎖期為0天,流量抵押提現的解鎖期為3天。
結語
EpiKProtocol還開啟了在分布式治理領域的探索,于7月20日發布了EpiKDAO。作為分布式存儲賽道首個DAO治理模型,社區用戶可以借助EpiKDAO參與EpiK生態資源的動態調節,有效保障EpiK社區的可持續發展,修復未來可能發生的資源錯配問題。
隨著Web3.0時代的日益來臨,數據的重要性日益凸顯。EpiKProtocol從數據標注到數據分布式存儲再到對接企業實現數據應用,打造了一個低門檻、高效率的數據收益共享閉環,未來EpiKProtocol如何實現豐富的落地應用場景值得期待。
Tags:EPIKROTCOLTOCEpik PrimeYYFI ProtocolDucato Protocol TokenGET Protocol
本文來源于鏈新聞,作者為JamesChiu。 FTX創始人SamBankman-Fried近日接受《彭博社》專訪,專題題目是《理想vs.現實:加密貨幣的未來》.
1900/1/1 0:00:00本文系鏈捕手原創文章,作者為RichardLee,并經由龔荃宇編輯。在經歷最為瘋狂的半年后,中國的加密礦業在5至6月進入了一段急劇動蕩的時期.
1900/1/1 0:00:00鏈捕手消息,美國證券交易委員會披露的文件顯示,美元穩定幣USDC發行機構Circle已于8月6日向SEC提交了FormS-4上市文件,包含初步代理聲明和招股說明書.
1900/1/1 0:00:00鏈捕手消息,以太坊客戶端Nethermind在推特上表示,難度炸彈和EIP-3554是針對試圖分叉鏈的攻擊者的防御措施,它確保以太坊有持續的維護和變更的緊迫性.
1900/1/1 0:00:00鏈捕手消息,PolyNetwork今日在致白帽黑客的《寫在PolyNetwork主網上線一周年的一封公開信》中表示,在攻擊事件發生前.
1900/1/1 0:00:00鏈捕手消息,特斯拉在2月份宣布購買了價值15億美元的比特幣。據《財富》網站估算,特斯拉共計買入了46000枚比特幣,平均買入價格約為32600美元.
1900/1/1 0:00:00