騰訊數據安全專家談聯邦學習開源項目FATE:通往隱私保護理想將來的橋樑

數據孤島、數據隱私以及數據安全,是目前人工智能和雲計算在大規模產業化應用過程當中繞不開的「三座大山」。git

 

「聯邦學習」做爲新一代的人工智能算法,能在數據不出本地的狀況下,實現共同建模,提高AI模型的效果,從而保證數據隱私安全,突破數據孤島和小數據的限制,這無疑成爲了跨越「三座大山」的途徑之一。所以,做爲聯邦學習全球首個工業級開源項目,FATE也受到了各方關注,開發者們對加入社區建設紛紛表示期待。(FATE開源社區地址:https://github.com/FederatedAI/FATE)github

 

而在貢獻者激勵機制推出之後,FATE開源社區迎來了首位一級貢獻者——來自騰訊雲的劉洋。聯邦學習怎樣賦能行業數據安全?隱私保護從業者怎樣評價FATE?劉洋博士在採訪中表達了本身的見解。算法

 

 

 

 

 

數據運算提效70% 加速企業應用落地安全

 

博士畢業於澳大利亞國立大學的劉洋,同時是騰訊雲的高級研究員,負責騰訊神盾沙箱的隱私保護算法部分。劉洋表示,因自身從業領域的緣故,從年初就開始密切關注着「聯邦學習」。框架

 

也所以,FATE進入了其視野,受到了劉洋及騰訊雲團隊的重點關注。在對FATE進行深刻了解後,劉洋認爲騰訊神盾沙箱打造的隱私安全+分佈式學習的理念,與FATE要解決的「數據安全」「數據隱私」「數據合規」三大問題不謀而合,並逐步開始使用FATE知足神盾沙箱的功能需求。機器學習

 

 

 

 

劉洋表示,通過長期接觸後,對FATE的邏輯迴歸和XGBoost算法流十分認同,所以也開始加入FATE開源社區建設,提出了優化建議——利用對稱的仿射密碼替代Paillier密碼,將訓練時間提高70%以上,從而給同態運算「減負」。將來合做企業在應用優化事後的FATE版本時,能夠有效下降數據運算的時間成本,提高企業在AI時代的技術競爭能力。分佈式

 

行業負重前行 數據安全迫在眉睫工具

 

AI應用場景中,將多方數據中心式合併處理的傳統合做方式,存在着嚴重的隱私泄露問題,這一癥結甚至成爲了企業大規模應用AI的關鍵阻礙。學習

 

在劉洋看來,破局關鍵仍在於數據安全問題的解決,即數據privacy和utility的折衷問題。具體來講,數據要想安全的從孤島分享出去,必須經歷某些「蒙面」操做:經過密碼學工具將有效數據轉換成亂碼,privacy保住了,但密鑰在誰手中,極大的影響數據的utility;用噪聲混淆原始數據也能夠,例如差分隱私,噪聲越大,越保證privacy,但使用者拿到數據發揮的utility越低。怎樣在privacy和utility中尋求一條折衷之路,是數據安全流通的關鍵問題之一。優化

 

將來理想的狀態是,任何數據使用者可以在自由流動和聚合的分佈式數據之上,進行高效的數據挖掘操做,而絲毫感受不到隱私保護的羈絆。在MPC(Multi-party Computation,多方安全計算)領域,目前行業還停留在混淆電路、可信計算等解決方案,雖然支持的計算任務具備通常性,但須要額外的硬件支持,學習成本較高,阻礙了規模化應用的同時,也不利於安全數據聯盟的造成。

 

而聯邦學習在具備普適性的聯邦框架中,針對每一種或每一類機器學習算法進行訂製化的隱私保護改造,使它們的使用無異於經典的中心式機器學習模型。相比之下,聯邦學習在穩住成本的基礎上,確保了易用性。劉洋稱,對於企業而言,聯邦學習提供的解決方案更具吸引力;對於行業而言,更便捷的操做將吸引更多開發人員的投入,從而推動安全數據聯盟的構建。

 

FATE生態×騰訊雲 數據安全將來可期

 

今年5月初起,FATE和騰訊雲神盾沙箱就開始進行業務往來和技術交流,目前神盾沙箱的核心計算模塊由FATE提供。在搭建平臺過程當中,雙方緊密合做。劉洋在採訪中表示,團隊在使用FATE框架、算法時,會將有效建議貢獻到FATE開源項目中,參與開源社區建設。

 

 

 

這種帶有「互助互惠,開源共築」特點的合做形式,在促進了神盾沙箱的產品打磨和FATE項目的完善的同時,也給其餘技術項目或團隊提供了很好的樣板示範——以開放的姿態擁抱新的技術,不只於自身有利,也將助推整個行業的發展。

 

在劉洋的設想中,將來二者能夠在提高技術影響力和業務落地等方面進行更深層次的協做,例如合做發表重要論文、提交專利和聯手接手內外部實際業務,造成「學術」「業界」兩開花的美好局面。

隨着愈來愈多貢獻者加入FATE理論標準與行業應用的建設,FATE勢必會迎來更廣闊的前景。對此,劉洋表示,神盾沙箱和FATE的聯手將會加速數據安全的紮根與生長,在數據孤島之上構建起安全數據聯盟的將來可期。

相關文章
相關標籤/搜索