近日,微衆銀行聯邦學習FATE開源社區迎來了兩位新貢獻者——來自騰訊的劉洋及秦姝琦,做爲雲計算安全領域的專家,兩位爲FATE構造了新的功能點,並在Github上提交修復了相關漏洞。(Github項目地址:https://github.com/FederatedAI/FATEgit
)從FATE的面世,到貢獻者激勵制度的推出,參與開源社區建設的數據安全行業從業者不斷踊現,FATE在業內的關注度、價值承認度逐步提高,聯邦學習生態正進一步深化及拓展。github
AI時代數據安全問題嚴峻,聯邦學習是必經解決路徑算法
人工智能的發展與普及不斷改變着人們的生活方式,但AI的實現離不開海量數據源的支撐。自大數據上升爲國家戰略後,其產業和應用獲得了快速發展,可是在數據豐富程度、數據質量、數據共享、大數據平臺安全和大數據產業生態等領域上,這一行業仍有許多亟待解決的問題。安全
做爲一種基於多方安全計算的分佈式機器學習技術,聯邦學習能讓參與各方能夠在不披露底層數據和底層數據的加密(混淆)形態的前提下共建模型,在行業應用中幫助不一樣機構打破隔閡,進行AI協做,同時各方的數據都不出本地,讓用戶隱私獲得保護。這樣一種雙贏的機器學習方式,讓聯邦學習成爲了AI時代大數據安全及隱私保護的必備技術。app
FATE(Federated AI Technology Enabler)是全球首個聯邦學習工業級開源框架,由微衆銀行AI團隊推出,從GitHub開源,到貢獻者激勵機制的發佈,微衆銀行AI團隊指望擁抱全部從業者,以開放的姿態,共建聯邦學習生態。(官網地址:https://www.fedai.org.cn/cn/)框架
FATE直擊業界痛點,搭建數據安全多方合做橋樑機器學習
新晉貢獻者中,秦姝琦來自於騰訊神盾沙箱,在採訪中她提到,目前行業面臨着許多痛點,如爲了牟取利益,部分手機APP「越權」獲取用戶信息,衍生出規模龐大的黑灰產業鏈。甚至還有黑灰產組織對熱門app進行反編譯,修改源碼後經假裝從新投放到應用市場來獲取數據和利益。分佈式
除此之外,數據的確權也是一個難點。非法採集到的數據最後會就會成爲黑產市場上的商品。而在數據流通這裏,即便是合法受權給第三方使用數據,也沒法保證第三方不會私下拷貝濫用數據。學習
而其團隊研究構建的神盾沙箱,在結合FATE計算框架後,則能夠解決數據流通中的隱私安全問題,同時爲大數據產品和AI產品的結合提供隱私安全的解決方案。使得APP廠商減小對用戶數據需求量同時也能得到更龐大、標註質量更好的數據集。大數據
秦姝琦表示,聯邦學習是應對大數據新時代下新問題的新解決方案,在數據安全多方合做領域,聯邦學習FATE結合神盾沙箱的應用,能夠經過技術手段使得數據流通合法合規,從而打破「信息孤島」現狀。
發力開源生態,推進數據安全從業者共建FATE
據悉,騰訊神盾沙箱目前的核心計算模塊由FATE提供,神盾沙箱項目團隊在使用FATE框架、算法的過程當中碰到的不足會主動尋求方法改進,並將其貢獻到FATE開源項目中,這種合做形式同時促進了神盾沙箱的產品打磨和FATE項目的完善。
隨着更多的人加入聯邦生態,互相推進着打磨產品的進步,這種正循環將會使更多的人受益。一個有活力的開源生態離不開貢獻,以及成員間的彼此的促進。
目前,FATE開源社區激勵制度已全面上線,參與建設的貢獻者將得到官方證書與相應激勵。做爲聯邦學習全球首個工業級開源社區,FATE在Github上線僅數月,Star數便突破700,從知名高校香港科技大學學子敬清賀,到知名科技企業騰訊劉洋、秦姝琦紛紛參與貢獻,無不代表FATE對數據安全強大的解決能力。最近騰訊雲盾沙箱與FATE開展的進一步合做,更是彰顯了FATE的可靠性與適配能力,FATE正走向更開闊的行業領域。
聯邦學習促進人工智能領域的開放協同,提高人工智能數據流通性,推進多組織機構高度協同合做,促進人工智能產業安全健康發展及賦能各個應用領域。在此背景下,不管是FATE的開源,仍是騰訊雲參與貢獻,咱們均可以窺見聯邦學習生態的蓬勃發展。將來將會有更多產業領域受益,中國數據安全也將邁向新的臺階。