也許你們還不知道,現在已經是一個用數據說話的年代了,那么區塊鏈就是最好的例子,因為區塊鏈基于大數據,這個觀點你認同嗎?區塊鏈基于大數據1.區塊鏈技術區塊鏈角色更多關注全節點作為數據源提供方,依賴區塊鏈技術的分布式、公開透明、可追溯、不可篡改等特征,同時結合數據分布式存儲、點對點傳輸、共識機制、加密算法等多種技術融合形成的區塊鏈創新應用模式。
在區塊鏈瀏覽器的整體架構中,區塊鏈作為數據源存在的挑戰與傳統大數據進行ETL比較。
多幣種主鏈數據組織差異大,在眾多主鏈數據持有能力上,需要思考如何在系統架構上提出能夠保證通用結構復用,又要兼顧多主鏈個性化靈活支持的需求。同時,理解區塊鏈全節點數據的業務特征、不同版本之間差異、分叉對不同高度的解析細節上在研發周期中占用較大比重。
美股盤前,區塊鏈概念股大跌:行情顯示,美股盤前,SOS跌超14%,Riot Blockchain跌超11%,嘉楠科技跌超12%,Marathon Patent跌近12%。此前比特幣跌破4.5萬美元關口,24小時跌幅超10%。[2021/2/26 17:56:10]
以往大數據架構不需要太多的關注數據業務本身涵義,更多聚焦在數據流轉、計算、存儲,而區塊鏈則需要對業務了解放在首位,起點較高。
2.大數據技術
在OKLink區塊鏈瀏覽器上,大數據聚焦在區塊鏈數據源解析之后,推送到Kafka消息隊列后續,對數據進行統計分析,實時計算和離線計算部分。
同時,在瀏覽器前端展示ToC提供線上檢索服務和對不同的數據應用放提供ToB的API訪問方式。
動態 | 聚龍股份:公司涉及區塊鏈技術的相關業務尚未能大規模推廣及產生穩定收益:聚龍股份:公司涉及區塊鏈技術的相關業務尚未能大規模推廣及產生穩定收益。[2019/10/30]
當然,區塊鏈瀏覽器中大數據的實踐和傳統互聯網大數據有著較為明顯區分特征,下面逐一說明:
A)數據中臺
區塊鏈大數據更加側重數據中臺的角色,而不是傳統的后臺提供數據分析、離線計算的位置。之所以在數據中臺委以重任,是需要更快、更為靈活的交付用戶數據。
所以查詢快是OKLink的一大亮點,要提供區塊鏈數據的快速交付,需要在數據解析到流轉、計算存儲、查詢4個方面整個鏈路做全方面的優化,整體協作來完成快速交付。
時效性在區塊鏈對ToB方面至關重要,ms級別的先機會對類似量化交易及時做出預判,類似傳統意義提到的時間就是金錢,唯快不破。
動態 | 區塊鏈初創公司20|30在倫敦證交所運營平臺上籌集300萬英鎊:據Coindesk報道,區塊鏈初創公司20|30通過在倫敦證券交易所集團(LSEG)運營的一個平臺Turquoise上出售通證化的股票,籌集了300萬英鎊(合393萬美元)。據此前報道,LSEG和英國金融市場行為監管局(FCA)曾表示,他們正在與20|30和分布式賬本技術初創公司Nivaura合作,試圖首次證明,一家英國公司的股權可以在完全符合監管、清算和結算體系的情況下進行通證化并發行。目前看來,該計劃的第一階段似乎已經成功實施。LSEG表示,該項目旨在探索“幫助企業以更高效、更精簡的方式籌集資金的工具”。(注:該公司是去年7月公布的FCA監管沙箱的第四批成員之一。)[2019/4/15]
B)數據弱化分區特征
聲音 | 黑森林量化CEO張華:區塊鏈技術要發展應該和實體經濟結合:金色財經現場報道,1月24日,在由金色財經主辦的金色沙龍深圳站第一期活動上,黑森林量化CEO張華參加了《量化市場-暗流涌動 如何破冰》圓桌對話環節,他指出,市場變熊,流動性降低,對CTA的策略的影響很大,現在能做的只有簡單的套利。而區塊鏈技術要想得到真正的發展,不應該和一些邊角的產業結合,應該和實體經濟結合,未來各類加密貨幣的市值也有可能隨著區塊鏈技術的發展得到上升,流動性增強。[2019/1/24]
在互聯網等傳統大數據進行存儲,一般會對數據按照日期進行一級分區,對于數據進行分布式存儲和計算在MPP架構中應用非常嫻熟,數據可以根據使用情況做熱數據、溫數據、冷數據處理分層Cache、歸檔等處理。
而區塊鏈大數據存儲在業務層面需要時刻準備交付,即數據可以理解均為熱點數據,例如按照地址檢索交易記錄,即便較久交易也需要實時交付。
同時,時間維度在做區塊鏈的業務場景應用中不重要,反而區塊高度、交易Hash、地址等維度命中率在大部分場景下有較多應用。
在架構層面,滿足弱化分區特征,需要實現索引和數據的異構引擎配合存儲和計算,在服務層面需要做到數據一致性、檢索過程業務透明、新增索引項靈活配置、熱部署等工程方面挑戰。
C)流批處理
流批處理指的是區塊鏈計算指標需要結合歷史的統計信息和當前的實時數據做更新,例如地址的累計交易金額=歷史累計交易金額+當前交易金額。
前面提到如果大數據處于后臺角色,可以完全通過離線計算批處理的方式進行統計,這樣的方式即保證了準確性,又相對保險,但在時間上會有滯后。而作為數據中臺能快速準確交付用戶信息,這里需要歷史聚合數據和當前變更數據做實時計算。
這種場景最大的挑戰是數據指標的冷啟動+實時計算結合,并且一個指標從定義到交付更為靈活,就需要在架構設計上支持配置化的指標定義,而非CasebyCase的定制開發。
OKLink實時計算平臺“閃電”中采用Flink作為流批數據計算的架構選型,支持靈活定義Source數據源、ETL數據上下游銜接和靈活定義Sink輸出。在存儲方面借助HBase存儲滿足實時更新和按照Key檢索,歷史聚合信息計算結果存儲在HBase,并且記錄歷史截止交易高度,閃電平臺敏銳察覺數據變更并且延續后續實時計算過程。
D)數據補償機制
即當線上數據出現問題之后,如何能夠快速修正數據。一般來說,數據出現問題的原因包括:計算邏輯變更、數據解析bug、區塊分叉、數據延遲交付等因素。
這些因素雖然在瀏覽器上線后出現的頻率較低,但是每次出現人工處理成本較高,主要表現在處理時間、人工核驗的質量參差不齊。
數據補償機制是數據質量保證重要的途徑,可以滿足數據的最終一致性需求。數據補償的處理步驟可以歸納為識別壞數據、定位數據源、清理目標寫入、數據重計算四個部分,因為針對不同的數據源處理步驟大同小異,所以非常適合工程化方案解決。
當前這里面也存在一些挑戰,比如壞數據出現位置監控與定位、已寫入引擎數據識別和清楚、修正補丁熱部署熱加載避免停服、旁路數據修正等。
E)新數據頻繁變更
數據變更在互聯網場景更多體現在OLTP數據庫中,而在OLAP場景下更多為沉淀數據,追加較多變更非常少。
頻繁變更帶來的問題是數據碎片化嚴重、標記刪除和定期歸檔工程化較為復雜,目標存儲引擎支持更新,同時如果支持冪等性業務操作,還需要識別已寫入數據哪些是覆蓋想,哪些是刪除項。
所以說這個區塊鏈基于大數據,這話不摻假吧。有一天你能成功的滲透區塊鏈這個詞語的意思,你離發達也就不遠了。
親愛的社區用戶: 考慮到FF、CITY新合約兌換是一個長期的過程,目前仍有部分社區用戶未完成FF新合約資產兌換工作,基于對社區負責任的角度.
1900/1/1 0:00:00尊敬的LBank用戶: 出于市場透明性考慮,LBKSolar「Suter」承諾LBK社區對Suter解鎖流通盤進行每日公示.
1900/1/1 0:00:00尊敬的用戶: 投資者保護基金由火幣全球站于2018年1月推出,用于防范平臺突發風險,為火幣用戶提供先行賠付的權益.
1900/1/1 0:00:00Algorand計劃于區塊高度3,705,466開始2.0網絡升級,Gate.io已經第一時間完成2.0升級,經過觀測新版網絡出塊正常,目前Gate.io已經恢復ALGO的充值和提現服務.
1900/1/1 0:00:00尊敬的CITEX用戶: NRG上線CITEXP板交易區,并開放NRG/BTC交易對。NRG充值:2019年12月20日10:00NRG交易:2019年12月20日16:00NRG提現:2019年.
1900/1/1 0:00:00了解區塊鏈,從這里出發,更多詳情,請查看《天天鏈訊》公眾號(ID:Blockchain12345) 宏觀政策 據21財經12月19日報道.
1900/1/1 0:00:00