簡介:DataTrust(隱私加強計算產品)是基於阿里雲底層多項基礎安全能力,通過阿里雲數據中臺豐富的客戶業務實踐,構建的一款爲企業數據安全流通的產品。算法
隨着包括零售、製造、金融等多行業數字化轉型加速推動,數據的價值正在被愈來愈多的企業普遍認知,國家亦出臺多項政策,明確數據要素的基礎性、戰略性地位,要求增強數據資源整合、應用於安全管理,提高數據資源價值。安全
同時,面對持續擴大的安全威脅維度和行業監管要求,企業對數據安全的防禦力度要求也在不斷加碼,亟需一套完整的數據安全產品,實現不一樣場景應對的數據安全保護。網絡
響應國家及市場要求,近日,阿里雲數據中臺產品矩陣之一的隱私加強計算產品DataTrust正式對外發布。機器學習
記者瞭解到,DataTrust依託阿里雲底層多項基礎安全能力,及阿里雲數據中臺豐富的應用場景實踐,可以在保障數據安全的前提下完成多方數據聯合分析、聯合訓練、聯合預測,實現數據價值的流通,爲企業提供立足數據業務原生的數據安全流通解決方案。函數
可用不可見 保障數據多方計算安全工具
營銷投放是零售企業最常面對的商業場景之一。性能
零售企業選擇一個媒介渠道進行營銷投放時,爲了保證相對最優投放效果,每每須要提供自身已覆蓋市場數據與渠道數據交叉計算分析,並進行模型訓練和預測,以確保這次營銷投放的確可以觸達目標市場。學習
但在這個過程當中,企業每每又不但願自身市場數據被媒介渠道獲悉,所以在數據處理過程當中,須要有個「安全環境」,作到在數據不流通的前提下實現數據價值的流通,達到包括數據分析、匹配、分層等動做都侷限在「安全環境」範圍內產生,待數據處理完成後,直接產生數據結果,以方便後續基於業務場景的直接使用。
「安全環境」的做用就在於,可以讓企業和平臺都在沒法獲悉對方基礎數據的前提下,完成數據業務分析及數據應用,作到數據的可用不可見。大數據
而Datatrust就充當了「安全環境」角色,基於業內領先的隱私加強技術,它可以爲數據參與多方構建一個統一的數據安全融通環境,實現ID去標識化、特徵標籤保護、商業數據保護等多方面目的——此外,DataTrust經過一體化的使用交互和體驗,大大下降了企業使用門檻,同時數據處理動做和流程可以被清晰表達。
目前,DataTrust產品能力已經過阿里雲數據中臺在多個行業得到實踐,尤爲是在「智能營銷」「智能廣告推薦」等場景,得到企業極大承認。ui
多維核心技術 數據安全背後的多重把關
爲何DataTrust一經推出就能經受多行業不一樣數據安全場景挑戰?除了依靠阿里雲數據中臺在零售、金融、互聯網等多個細分行業解決方案的切入外,更重要的一點還在於,其內嵌的四大核心技術,可針對不一樣行業數據安全標準及企業個性化數據隱私需求,給予特定匹配。
好比,零售企業在數據安全層面核心保障數據合規使用及防泄漏(隱私保護),須要充分遵照包括《網絡安全法》《電商法》《消費者保護法》等法律法規的要求;但在金融或者醫療行業,有更高的基於行業的數據安全保障標準,所以在這些行業,在數據安全技術上也必須提出更高要求。
據介紹,DataTrust現階段已擁有四大隱私加強計算核心技術。
1、可信執行環境(Trusted Execution Environment,TEE)
TEE是硬件中的一個獨立的安全環境,與操做系統並行運行。硬件自己保證TEE中代碼和數據的機密性和完整性,也就是說,TEE是硬件服務提供商應用硬件在現實世界中構造的安全計算環境。
應用TEE實現隱私加強計算的過程能夠經過下圖描述。
· 步驟1:各個參與方將本身的數據x經過安全鏈路傳輸給TEE;
· 步驟2:TEE在保證機密性和完整性的條件下完成計算任務;
· 步驟3:TEE經過安全鏈路將計算結果發送給各個參與方。
目前,DataTrust應用英特爾的軟件防禦擴展(Software Guard Extensions,SGX)做爲TEE。
SGX是Intel CPU提供的一組指令集和內存訪問機制,應用程序能夠經過這組指令集和內存訪問機制實現一個被稱爲安全區(Enclave)的容器,在應用程序的地址空間中劃分出一個被保護的區域,爲容器內的代碼和數據提供機密性和完整性保護,免受擁有特殊權限的惡意軟件的破壞。
2、安全多方計算(Secure Multi-Party Computation,MPC)
MPC是密碼學中的定義,意爲在無可信計算方的狀況下,多個參與方各自持有祕密輸入完成對某個函數的計算,但每一個參與方最終只能獲得計算結果和能從本身輸入和計算結果中推出的信息,其餘信息都可獲得保護。
安全多方計算的定義能夠經過下圖描述。
DataTrust目前支持專用MPC協議隱私集合求交(Private Set Intersection,PSI)實現兩方數據的安全匹配;同時,支持上億級別輸入的PSI協議,並根據單次匹配、週期性匹配、增量匹配等實際業務場景提供不一樣類型PSI協議的支持。
3、聯邦學習(Federated Learning,FL)
聯邦學習是一種多個參與方在保證各自原始私有數據不出數據方定義的私有邊界的前提下,協做完成某項機器學習任務的機器學習模式。
根據隱私安全訴求與訓練效率的不一樣,能夠經過MPC、同態加密(Homomorphic Encryption,HE)、差分隱私(定義見下)等多種方式實現聯邦學習。
DataTrust支持基於差分隱私的聯邦學習,相應技術方案在保證效果和性能的前提下,擁有安全上的理論支撐。值得注意的是,DataTrust支持的聯邦學習算法已覆蓋神經網絡和決策樹等經常使用算法。
4、差分隱私(Differential Privacy,DP)
DP是一種基於對數據引入隨機擾動,並從理論層面度量隨機擾動所帶來的隱私保護程度的隱私保護方法。根據隨機擾動方式的不一樣,DP分爲在原始數據層面進行隨機擾動的本地差分隱私(Local Differential Privacy,LDP)和在計算結果層面進行隨機擾動的中心差分隱私(Central Differential Privacy,CDP)。
DataTrust在FL層面應用DP實現訓練/預測過程當中的我的隱私保護,並綜合使用CDP/LDP技術,以支持不一樣的學習/預測任務。
須要注意的是,DataTrust的多套核心技術並不是一成不變,而是可以依據企業日益豐富的數據安全場景,進行升級更迭,同時還將繼續引入更多行業領先的隱私加強計算技術,充盈產品底層能力,「持續響應政策數據監管要求,順應市場數據安全訴求,將保障數據安全的能力全量開放給有須要的企業,將會是DataTrust將來至關長時間內的戰略目標。」DataTrust產品負責人如是說。
數據中臺是企業數智化的必經之路,阿里巴巴認爲數據中臺是集方法論、工具、組織於一體的,「快」、「準」、「全」、「統」、「通」的智能大數據體系。
目前正經過阿里雲對外輸出系列解決方案,包括通用數據中臺解決方案、零售數據中臺解決方案、金融數據中臺解決方案、互聯網數據中臺解決方案、政務數據中臺解決方案等細分場景。
其中阿里雲數據中臺產品矩陣是以Dataphin爲基座,以Quick系列爲業務場景化切入,包括:
• - Dataphin,一站式、智能化的數據構建及管理平臺;
• - Quick BI,隨時隨地 智能決策;
• - Quick Audience,全方位洞察、全域營銷、智能增加;
• - Quick A+, 跨多端全域應用體驗分析及洞察的一站式數據化運營平臺;
• - Quick Stock, 智能貨品運營平臺;
• - Quick Decision,智能決策平臺。
原文連接本文爲阿里雲原創內容,未經容許不得轉載。