少妇人妻偷人精品一区二区,国产伦精品一区二区三区妓女,狼牙套加粗震动入珠套h,被狼交的女人(h)

中國金屬材料流通協會,歡迎您!

English服務熱線:010-59231580

搜索

區塊鏈在數據流通中的應用

區塊鏈在數據流通中的應用

閆樹,卿蘇德,魏凱

中國信息通信研究院,北京 100191

摘要:大數據的流通是創造數據價值的關鍵一環,然而目前數據流通面臨著諸多問題。區塊鏈是一種分布式賬本技術,具有去中心化和不可篡改特性,可以解決數據流通過程中的一些痛點問題。介紹了區塊鏈技術的特性,闡述了利用區塊鏈改造授權存證環節、進行數據溯源和實現智能合約的主要思路,梳理了實現數據流通的整體架構。在此基礎上,給出了國外利用區塊鏈進行數據流通的應用實例,并介紹了一些其他的數據流通新技術。

關鍵詞:區塊鏈;數據流通;智能合約

doi:10.11959/j.issn.2096-0271.2018001

論文引用格式:閆樹, 卿蘇德, 魏凱. 區塊鏈在數據流通中的應用[J]. 大數據, 2018, 4(1): 3-12.

YAN S, QING S D, WEI K. Application of blockchain in data circulation[J]. Big Data Research, 2018, 4(1): 3-12.


1  引言

數據流通是指在數據提供方和數據需求方之間按照一定流通規則進行的以數據為對象的行為。這種情況下,數據脫離了原有使用場景,變更了使用目的。隨著數據的資源價值逐漸得到認可以及大數據產業鏈結構日益完整,我國數據流通的需求也日益迫切。無論是共享還是交易,數據流通都使數據從數據產生端轉移至數據應用端,優化了資源配置,正在成為釋放數據價值的重要環節[1,2]。

根據數據使用的不同需求,流通的數據通常包括原始數據和加工處理后的衍生數據,涉及數據應用程序編程接口(application programming interface,API)、數據報告、原始數據分組、技術算法、數據應用等不同類型的數據資源商品。結合不同的數據使用需求,數據流通服務提供者通常采用不同的流通模式,如僅為提供方和需求方建立數據流通或服務關系的“中介型”服務;自主采集數據并對外銷售的“采產銷”型服務;對數據進一步加工處理,產生有價值的衍生數據或應用,并對外提供的“加工服務型”服務。在這些流通模式下數據提供方和數據需求方通常不是同一實體[3]。

然而,我國數據流通,特別是交易產業數據流通,仍然面臨著嚴重的問題,如數據隱私保護問題極其突出、數據權屬問題需要得到準確界定、數據流通各環節標準缺乏統一共識、非法數據交易猖獗等。此外,隨著 《中華人民共和國網絡安全法》的正式實施,販賣非法數據正式入刑。在配套法規和標準不盡完善的情況下,許多企業為了規避風險,紛紛暫緩或縮小了數據流通產業規模。數據流通產業面臨近年來最大的挑戰,亟須通過新的技術應用提供新的保障。

近年來興起的區塊鏈技術,從技術角度對上述問題提供了一種解決思路。本文主要介紹區塊鏈技術解決數據流通痛點中的幾個關鍵應用場景,并梳理利用區塊鏈實現數據流通的整體架構。


2  區塊鏈技術概述

區塊鏈是一種基于密碼學原理構建的分布式共享數據庫,其本質是通過去中心化和去信任的方式集體維護一個可靠數據庫的技術方案。該技術方案允許系統內的所有節點都備份當前區塊鏈的一個完整副本,每隔一段時間,系統選出這段時間記賬最快最好的節點,該節點利用密碼學技術計算和驗證,將這段時間內的所有有效交易信息和當前區塊鏈的“數字簽名”記錄到一個新區塊上,并將新區塊鏈接至當前區塊鏈副本的末尾,形成新的區塊鏈副本。區塊鏈的任何變動都會依托整個系統的消息廣播,實現全網區塊鏈副本的更新。如上所述,區塊鏈技術具備分布式對等、去信任、集體維護和無法篡改四大特點,因而與數據流通場景有著天然的契合度。

廣義來講,區塊鏈是一種全新的分布式基礎架構與計算范式。其利用塊鏈式數據結構驗證與存儲數據、利用分布式節點共識算法生成和更新數據、利用密碼學方式保證數據傳輸和訪問安全、利用由自動化腳本代碼組成的智能合約編程和操作數據。狹義來講,區塊鏈是按照時間順序將數據區塊依次連接形成的一種鏈式數據結構,是以密碼學方法保證數據塊的不可篡改和不可偽造的分布式賬本。自區塊鏈發展以來,全球金融體系率先對區塊鏈技術進行各種試驗與糾正。如今,區塊鏈的發展已經可以通過分布式賬本、不可篡改等特性,結合智能合約等技術,解決實際的復雜業務場景。

區塊鏈平臺整體上可劃分為網絡層、共識層、數據層、智能合約層和應用層5個層次。為了實現數據的不可篡改性,區塊鏈引入了以區塊為單位的鏈式結構。不同區塊鏈平臺在數據結構的具體細節雖有差異,但整體上基本相同。以比特幣為例,每個區塊由區塊頭和區塊體兩部分組成,區塊體中存放了自前一區塊之后發生的多筆交易;區塊頭中存放了前塊散列(preblockHash)、隨機數(nonce)、Merkle根(Merkle root)等。區塊鏈基于兩種散列結構保障了數據的不可篡改性,即 Merkle 樹和區塊鏈表。


3  利用區塊鏈解決數據流通中的關鍵問題

通過區塊鏈技術,可以在授權存在、數據溯源等數據流通的關鍵問題上進行改善,同時實現智能合約等新交易手段。

3.1 利用區塊鏈改造授權存證環節

長期以來,由于數據流通方、加工方、使用方的分離,數據二次交易沒有手段稽核及管控,無法實時校驗授權真實性,數據交易授權在技術層面并沒有過多進展,往往采用如圖2所示的傳統模式。在這種模式下,用戶通過數據提供方或數據交易機構等中介機構進行一對一、單獨的授權。

在傳統模式下,授權存證可以被任意篡改,不具備公信力。由于需要相應責任認定條款,每個應用和數據源公司都需要單獨簽署協議。此外,查詢授權記錄需要單獨開發接口,而這一點往往被忽略。由于授權和業務流程綁定,用戶加入和退出都較為困難。

區塊鏈技術的發展使得這一領域產生了新的突破。在區塊鏈模式下,完整的授權鑒權流程如圖3所示。用戶簽署電子協議,授權給數據提供方相應權限。數據提供方首先通過應用系統本地存儲憑證,進而將授權信息上傳至授權信息鏈。應用系統執行鏈上代碼,發起鏈上查詢,并記錄授權信息到區塊。當數據需求方提交數據需求時,在鏈上發起鑒權交易,確認用戶是否授權。接下來,鏈上驗證節點返回授權信息,如確已授權,則返回相應數據。

區塊鏈模式避免了傳統模式的缺陷。任何節點可以記錄授權信息,且不可更改。多方可以實時共享授權記錄,查詢效率較高。此外,授權與業務解耦,可隨時加入和退出。

以中興通訊股份有限公司為例,其基于區塊鏈推出電子證照共享交換平臺,利用區塊鏈技術的平權、共建的特點,依據共建共享的原則實現全面數據歸集;通過區塊鏈發布可信任的證照信息,實現原始發布部門數字簽名的不可篡改和數據可信;基于區塊鏈技術的非對稱加密特點,對每條信息進行單獨加密(每條公民的信息有單獨的解密私鑰),防止信息泄露,加速推行“互聯網+政務服務”,打造政務服務“一張網”,創新實現電子證照在市級范圍內跨區域的信息歸集、快速檢索和結果應用,未來拓展到全省的電子證照共享交換平臺,打造可信的省市級政府政務信息共享開放平臺,保障政府各職能部門之間的數據共享開放安全。

3.2  利用區塊鏈進行數據溯源

區塊鏈技術的開放性、自治性、去中心化的特點非常適合數據交易(流通)溯源。目前,很多專家持有這樣一種觀點:數據+區塊鏈=數據資產。區塊鏈的價值就體現在對數據構造出了某種程度的“唯一性”。將帶有唯一標識的數據附于區塊鏈上進行交易,很自然地解決了數據難以溯源的問題。

區塊鏈網絡中多個參與計算的節點共同參與數據計算和記錄,并且互相驗證其信息有效性,既可進行信息防偽,又提供了可追溯路徑。通過信息上鏈,各個區塊的交易信息即構成完整的交易明細清單,不可篡改地記錄了每筆交易的來龍去脈。當用戶對某個區塊的值有疑問時,可以準確方便地回溯交易記錄,進而對歷史交易記錄進行判別[5]。

當前,基于區塊鏈的供應鏈管控與溯源技術正在取得快速進展。例如,可以結合區塊鏈、比特幣相關技術和多重簽名技術設計供應鏈管控和溯源方案。將供應鏈內部實體分為“人物實體”“產品實體”和“權限實體”,將分層錢包技術用于實體密鑰的分配。構建基于分層錢包技術的樹形結構編碼體系,確立基于區塊鏈交易的去中心化權限管控機制和物權轉移信息記錄與驗證機制,從而提出利用區塊鏈實現供應鏈管控與溯源的新思路。

例如,食品安全一直是困擾人們的一大難題。以糧食為例,真正的五常大米年產不過10 0多萬噸,而市場上銷售五常大米的數量卻超過1 500萬噸,老百姓很難吃到真正的五常大米。2017年4月,智鏈(ChainNova)公司攜手我國北 方著名農場,運用基于Hyperledger Fabric 1.0的區塊鏈技術和公鑰 基礎設施(public key infrastructure,PKI)體系認證用戶身份,打造了農業區塊鏈應用。此應用對提交請求進行數字簽名并上傳至區塊鏈上,從而保證數據真實不可篡改。同時,結合物聯網、大數據等技術打通鏈上鏈下的全流程數據通道,實現了1 296萬畝黑土地大米的追蹤溯源與品質保障,將真正放心的高品質大米送到老百姓手中。

3.3 基于智能合約實現數據交易

智能合約由計算機科學家、加密大師尼克 ·薩博于1994年首次提出,是一個能夠自動執行合約條款的計算機程序,即一個預先編好的程序代碼,其對從外部獲得的數據信息進行識別并判斷。當滿足程序設定的條件時,隨即觸發系統自動執行相應的合約條款,以此完成交易和智能資產的轉移。然而,此概念提出后,因缺乏相應平臺執行合約而處于被埋沒的狀態。

區塊鏈技術的出現使智能合約重新被關注和研究。區塊鏈技術中的分布式賬本結構貫穿了業務層(如資產)、應用層(如智能合約)、中間件層(如分布式交易共識)和底層技術層(底層網絡)。智能合約能夠在應用層上進行存儲、驗證和執行,因此智能合約成為區塊鏈技術應用的重要特征。

以數據交易為例,賦予資產一些代碼并在區塊鏈上運行,使其成為全網共享資源,再通過外部數據觸發智能合約執行,以決定網絡中數據資產的流通、分配或轉移。智能合約的標的物并不限于數據,可以是汽車、房子等物質產權,也可以是股權、票據、數字貨幣等非物質產權。

智能合約不僅由代碼定義,還由代碼強制執行,因此智能合約完全自動且無法干預,合約雙方無需彼此信任。這恰恰符合數據交易的需要。數據交易機構可以通過建立規則,并用代碼表述形式代替合同,實現鏈上支付功能,提高自動化交易水平。


4  利用區塊鏈實現數據流通的整體架構

利用區塊鏈技術實現數據流通,可以從網絡交換層、共識機制層、數據存儲層、智能合約層和數據流通層5個層次進行梳理。

在網絡交換層,根據我國國家標準《信息系統安全等級保護基本要求》,非許可鏈(又稱公有鏈)的技術架構在物理訪問控制、網絡安全保障、服務性能要求、系統可靠運行等方面并不適應國家的相關規定,因此,非許可鏈的架構并不適應信息系統的等級保護規定,只能采用許可鏈(又稱聯盟鏈或私有鏈)的方式進行部署,需要通過專線接入、構建虛 擬私有網(virtual private network,VPN)等方式保證通信的安全可靠。在身份認證方面,使用行業類或者區域類的電子商務認證授權機構(CA認證)進行身份鑒權和接入控制,例如,做金融大數據交易的企業在進行接入時,需要通過中國人民銀行下屬的中國金融認證中心(China Financial Certification Authority,CFCA)的認證;在上海做大數據交易的機構進行接入時,需要通過上海市政府授權建立的上海市 數字證書認證中心有限公司(SHECA)的認證等。整個網絡是一種對等網絡(peer-to peer),系統中多個節點的失效、退出和加入,甚至是惡意節點的存在,都不會影響整個系統運行的穩定性和安全性。

在共識機制層,區塊鏈共識機制可以按照共識過程分為兩類:第一類是概率一致的共識,工程學上最終確認,如工作量證明(proof of work,POW)機制、權益證明(proof of stake,POS)機制等;第二類是絕對一致之后再共識,共識即確認,如拜占庭容錯(BFT)以及基于相關算法的變種(實用拜占庭容錯(PBFT)算法等)。如前所述,在許可鏈的范疇中,盡可能采用絕對一致的共識算法。

在數據存儲層,每筆數據交易都要持續跟蹤,采用不同于普通商業銀行的復式記賬法模型——基于交易的模型,即針對未花費交易輸出( unspent transaction output, UTXO)模型,更適合數據交易的管控和溯源。并且,通過塊鏈式數據結構實現環環相扣的歷史交易信息,通過非對稱密碼學技術實現公私鑰的加解密,有助于數據交易之前的數據確權和數據上鏈等操作。

在智能合約層,依靠智能合約在隔離沙箱中的獨立執行和相互校對能力,可以通過代碼編寫精確表達、實現數據分級分類管理的權限控制,有助于實現多個政府委辦局之間的層級映射,也有助于跨層級、跨部門、跨區域、跨平臺、跨行業的多機構協作聯動。在隱私保護方面,主要依托智能合約獨立運行的沙箱環境,除了數據授權方和利益相關方,無人能夠接觸到相關數據,并且嚴格按照智能合約設置的數據查看權限進行數據訪問,這從一定程度上保證了數據的隱私性。更多的隱私保護技術在后文會有更詳細的描述。通過智能合約的自動執行衍生出數據的自動交易,有助于解決數據定價難、精準計費難、交易撮合難等諸多問題。

在數據流通層,依托網絡交換層、共識機制層、數據存儲層、智能合約層等相關機制,數據提供方相較于傳統的數據流通平臺,更容易對自己的數據進行加密后傳輸,方便實現數據的確權管理。數據流通平臺面對加密后的數據,更容易自證清白,避免流通數據的泛濫復制。依托區塊鏈系統的溯源功能,數據所有方可以跟蹤數據的流通現狀,并且數據的每次使用都需要數據所有方的授權驗證,實現數據提供方對擁有數據的自主管控,數據需求方可以追溯數據的源頭,確保數據分析的真實性,提升數據分析的精準性和有效性。

值得指出的是,為增強數據流通的可靠性和安全性,區塊鏈在研發設計中可以更加關注以下幾點:一是選擇正確的共識算法,依據數據流通對時效性的要求,綜合考慮共識算法;二是選擇合規的個人信息保護算法,發揮區塊鏈的技術優勢, 嚴格進行個人信息保護;三是選擇適合的區塊鏈部署模式,依據數據流通的特點和安全性要求,以許可鏈為主,確定較為適宜的區塊鏈部署模式;四是可以將加密算法與數據的分級分類機制有機結合,對不同級別、不同敏感度的數據采用不同成本的加密算法,從而整體提升數據流通效率。


5  區塊鏈數據流通應用實例

區塊鏈在電子病歷數據流通共享等醫療健康領域的應用已經取得了重要進展。在美國,由 國家衛生信息技術協調辦公室(Office of the National Coordinator for Health Information Technology)主導的電子病歷(electronic medical record,EMR)共享已經進入應用階段,在此進行簡要介紹[6,7]。

EMR共享區塊鏈模型具有較強的可擴展性。每個區塊記錄患者的唯一身份識別信息、經過加密的病歷以及病歷的時間戳。為改善數據通達效率,區塊中還以標簽形式記錄了數據格式等元數據內容。所有醫療數據都存儲于被稱作數據湖(data lake)的數據庫中,其可存儲各種不同類型的數據(包括圖像、文檔等),這種存儲是加密并結合數字簽名技術的。數據湖中的數據在進行數據分析時具有極高的價值。

當醫療機構開出EMR時,會自動生成一個數字簽名來驗證開出機構的資格,隨后數據被加密傳輸至數據湖。同時,在EMR共享區塊鏈上,由數據湖生成一個包含患者唯一身份識別信息的記錄,并告知患者本人。

上傳后的數據在訪問控制方面非常嚴格。用戶可以決定誰能訪問和修改相應的數據,并且可查閱到信息在何時被何人訪問。

來自美國麻省理工學院的一些研究者還提出了利用區塊鏈技術去中心化地處理EMR信息的全新系統,并命名為MedRec。數據研究者和公共衛生機構等利益相關者作為“挖礦者”參與網絡,并獲取經過脫敏、用于科研的相關衛生數據。這種“挖礦”過程可認為是一種POW機制,也可以看作“比特幣”機制在數據流通中的應用嘗試。

事實上,由于歐盟《一般數據保護條例(European General Data Protection Regulation,GDPR)》的公布,數據保護的要求越來越高,導致更多的科研機構和企業開始探索利用區塊鏈實現數據流通,區塊鏈與云計算和安全審計等技術的結合受到廣泛關注。


6 其他數據安全解決方案

區塊鏈作為一種共享賬本技術,要做到數據隔離,還需要與其他數據安全技術組合使用,如零知識證明(zero-knowledge proof)、安全多方計算(secure multiparty computation,SMC)等。

6.1 零知識證明

零知識證明是由Goldwasser等人在20世紀80年代初提出的。它指的是證明者能夠在不向驗證者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的。

證明方和驗證方擁有相同的某一個函數或一系列的數值。零知識證明的一般過程如下:

●證明方向驗證方發送滿足一定條件的隨機值,這個隨機值稱為“承諾”;

●驗證方向證明方發送滿足一定條件的隨機值,這個隨機值稱為“挑戰”;

●證明方執行一個秘密的計算,并將結果發送給驗證方,這個結果稱為“響應”;

●驗證方對“響應”進行驗證,如果驗證失敗,則表明證明方不具有其所謂的“知識”,并退出此過程。否則,繼續從第一步開始,重復執行此過程t次。

如果每一次驗證方均驗證成功,則驗證方相信證明方擁有某種知識。而且此過程中,驗證方沒有得到關于這個知識的一點信息,成功地保護了證明方的隱私。

6.2 安全多方計算

安全多方計算用于解決一組互不信任的參與方之間保護隱私的協同計算問題,安全多方計算要確保輸入的獨立性、計算的正確性,同時不泄露輸入值給參與方。通常,一個安全多方計算問題是指在一個分布式網絡上計算基于任何輸入的任何概率函數,每個輸入方在這個分布式網絡上都擁有一個輸入,這個分布式網絡要確保輸入的獨立性、計算的正確性,而且除了各自的輸入外,不透露任何可用于推導其他輸入和輸出的信息[8]。

可以將安全多方計算簡單地概括成如下數學模型:在一個分布式網絡中,有n個互不信任的參與者P1,P2,…,Pn,每個參與者Pi秘密輸入xi,他們需要共同執行函數F:(x1,x2,…,xn)→(y1,y2,…,yn),其中yi為Pi得到的相應輸出。在函數F的計算過程中,要求任意參與者Pi( 除yi外)均不能夠得到其他參與者Pi(j≠i)的任何輸入信息。

一般化的安全多方計算協議,由于其計算任務的無關性(可以計算任意的功能函數),不需要再考慮特定的安全屬性及外部運行環境,所以對現階段復雜應用的安全保障具有得天獨厚的優勢。


7  結束語

區塊鏈通過建立一組公共賬本,由網絡中所有用戶共同記錄,保證信息的真實性與不可篡改性。這些特性使得區塊鏈有望成為破解數據流通難題的有效工具。然而,區塊鏈的性能瓶頸和延遲性問題也愈發明顯。除了技術方面的問題,其搭建成本以及與現有系統的融合性都成為制約其未來發展的因素。未來區塊鏈能否在數據流通中發揮更大的作用,還取決于很多因素。


返回列表