國務院發布了“十四五”數字經濟發展規劃,充分強調了數據的價值和意義。伴隨數據價值化的推進,很多數據安全技術被運用到了數據流通過程中,比如聯邦學習、同態加密、差分計算、中介計算等等,這些技術早已發展多年,落地的案例也不少。
然而,我國的數據流通現狀并不樂觀,一方面國外沒有成熟的經驗可以借鑒;另一方面缺少數據流通政策的實施細則;還有一個原因就是數據規模化安全流通還面臨一些實質性技術問題待解決。
數據想要大規模流通,首先要能大面積互通,大面積互通則需要解決大面積數據統一尋址、隱私存儲、便利使用、可控流通、留痕回溯等問題!
1 統一尋址和監管問題
如果數據流通想要形成大市場,要解決的首要問題就是統一尋址和監管問題,只有尋址統一,數據才可能像互聯網上的信息一樣,形成四通八達的流轉態勢;而且有了統一的“數據賬本”,監管也自然容易很多。在多方共管的思維框架下,其中“一方”要扮演一個很重要的角色,就是:可實現數據要素的統一命名、統一標簽和統一尋址,實現了這三個統一,也就能實現互聯網或行業網的數據可流轉、可控制和可監管,成規模數據的價值化也將有可能因此掀開全新篇章。
2 隱私安全問題
當我們知道了數據名稱、類型和位置信息以后,第二個需要解決的問題就是數據存儲的隱私安全問題,在電影哈利波特的故事情節中,伏地魔為了實現永生,將自己的靈魂分成7份,分別附著在6個不同地方的物體上,同時,伏地魔自己還守護一份,理論上,這樣的安全系數已經非常高了!
在現實生活中,如果一套數據被分成7份,并放在不同的存儲方手中,同時“自己”還保管一份,只有“使用方”通過了“多方和自己”的共同授權,才可以讀取數據,試想一下,這樣的安全性是不是都堪比“碟中諜”的絕密數據了!但如果分那么多份,丟失數據的風險也會大大增加,當然我們可以少分幾份或冗余存儲(這是后話,不再展開討論)。
同理,數據的存儲是不是也可以采用這種基于零知技術的多方隱私存儲和隱私計算架構?零知就是讓“存儲方/計算方”什么都不知道,實現原理是:“數據所有方”將數據碎片化加密后,分別存放在多個獨立的“數據存儲方/計算方”,甚至“數據所有方”自己也保管一份碎片密文,這樣數據的隱私性和可控性是不是就會高很多?而且數據確權的難題也將迎刃而解(因為缺少數據所有方的這份,其他任何方的數據都不好使),如果未來每個組織、每個機構、每個單位或個人,都能有“多方和自己”共同守護數據資產,誰還能輕易拿走我們的數據呢?
數據一旦可控和可授權,就可能會激活一個不可估量的海量數據流通市場!大量的個人和企業數據也因此可以進入合法渠道流通和銷售,這將會產生超乎想象的價值!個人可以自主銷售自己的隱私數據用于醫學科研或其他領域,企業可以提煉自己的數據給更廣泛的消費方,政府也可以開放海量的數據用于社會建設!
當然,密文存儲解決了,隱私安全的另一個問題就是:密鑰該如何保存?其實,在多方共管的模式下,這個問題非常好解決,一種方式是數據所有者找個安全的地方保管密鑰;另一種方式是找個可信的第三方保管密鑰;當然還可以把密鑰也分成多份,分別發送至不同的存儲方保管。無論用哪一種方式,密文和密鑰分離存儲是較好的選擇。
3 便利使用問題
第三個需要解決的問題是數據使用便利性與安全問題,數據是一種極易被“零成本”復制的資產,一套價值數百萬,甚至無法用金錢衡量的數據,可能很輕易地就被某些心懷不軌者或不法之徒拷走,小則給個人或組織造成影響,大則危及國家安全!
目前業界流行的虛擬數據沙箱技術,正是解決這類問題的有效手段。
用虛擬沙箱方式處理數據,首先,可以快速對接應用、數據庫、大數據、人工智能等業務系統;其次,“數據所有方”可通過沙箱將數據導入,然后碎化加密并分存到前面說的“多個數據共管方”,確保“多方不可見”;再次,“數據使用方/消費方”從“多方”獲取密文密鑰后,只能在沙箱內存中按需解密,也就是數據不落地,而“使用方”在計算出結果后,也只能回存到沙箱對應的“多個共管方”。
綜合來講,虛擬沙箱的作用就是透明化對接業務系統、獲取多方數據、對密文進行加解密操作、對數據防泄露和進行讀寫邊界控制,這樣既能實現獲取數據的便利性,又能保障數據的安全性!
4 可控流通問題
第四個問題就是數據的可控流通問題,數據既要能流轉到“使用方/消費方”手中,又要合規、可授權和可控制,這也是數據使用過程中的一個老大難問題!數據流好比水流,江河中有水,田地間有水,生活中還有自來水,如果這些水想怎么流就怎么流,就會給我們生活造成不便的影響,甚至會危及生命安全。現實中,這些水大多數情況都在按照規劃的方式有序流動。數據流轉是不是也可以借鑒我們的治水經驗呢?數據流轉要“分類”,要“引流”,要有“水庫”,有“閘門”,要有“河道和管道”,也要遵循“路歸路,橋歸橋”的原則,還要能按需供給和按量計費。
數據流如果可被治理,有了方向、有了規矩,不再四處亂“跑”,既可“放”,又可“管”,數據流動的可控問題就會簡單很多。比如:在零知技術體系中的前端沙箱數據流轉,數據流轉要設定用戶權限和其他規則,數據不能無序流轉;后端的數據流轉在基于零知技術的多方共管模式下可遵循:密文方只能向對等的密文方流轉,密鑰方也只向對等的密鑰方流轉,但決不能將所有碎片密文和密鑰交叉流轉或流向同一方。這樣,一套規范的前后端數據定向流轉系統就形成了。
5 留痕回溯問題
第五個問題是數據留痕和回溯問題,如果一些重要數據或交易數據被惡意修改或刪除,以及出現法律糾紛時,“存儲方”能將數據所有的變化情況記錄下來(類似于GIT的版本記錄功能),數據便可以回溯到發生改變之前的任意時間點“一探究竟”。這樣將會給數據流轉的“所有方”和“使用方”避免很多法律風險并降低舉證難度,同時還能增加數據資產健壯性。在多方共管模式下,“密文或密鑰存儲方”都應該具備全量的密文密鑰版本記錄功能,并具有多方同步回溯功能,這樣就可以實現多方隱私數據歷史查詢和數據恢復了。
結 語
通過對以上幾點問題的分析,不難發現,采用基于零知技術的“多方共管”模式就是:通過統一尋址技術解決供需雙方對大規模數據進行查找和監管問題;通過多方隱私存儲和隱私計算技術解決安全存儲、計算、確權、授權和控制問題;通過虛擬碎片化沙箱技術解決與業務系統的透明對接、數據碎化加密、數據不落地以及數據泄露問題;通過前后端數據定向流轉技術解決數據合規流動問題;通過多方版本回溯技術解決隱私數據事后追溯和恢復問題。
基于以上思維和技術架構,使用多方共管思維及一系列相關技術,是可以構建一套安全、開放、易用、靈活、可控、可管的數據規模化流通環境!無論是大數據、人工智能、物聯網、云計算、區塊鏈等場景,還是數據計算、數據交易、數據監管,都能做到數據在多方可控和多方監管下快速流通和使用。任何組織和個人都可借此擁有對數據所有權的“抓手”,并且有了可以信賴的“多個數據共管方”,相信這樣的數據安全系統也一定會對數據的規模化流通產生積極而深遠的影響。
更多信息可以來這里獲取==>>電子技術應用-AET<<