北京時間12月20日,Linux基金會旗下面向AI領域的頂級基金會——LF AI基金會(Linux Foundation Artificial Intelligence Foundation)正式宣佈,騰訊開源項目Angel從LF AI基金會畢業,也是中國首個從LF AI基金會畢業的開源項目。這意味着,Angel獲得全球技術專家的承認,成爲世界最頂級的AI開源項目之一。
LF AI基金會執行總監Ibrahim Haddad表示:「在Angel從孵化到畢業的過程當中,咱們能看到Angel在新功能完善和應用場景落地方面驚人的速度。隨着3.0版本的發佈,Angel在功能、適用性和對社區的貢獻等都有了很是優秀的表現。這也是整個AI開源社區在走向成熟並具有工業級生產能力的方向上邁出了一大步。」
Angel是騰訊的首個AI開源項目,於 2016 年末推出、2017年開源。做爲面向機器學習的第三代高性能計算平臺,Angel致力於解決稀疏數據大模型訓練以及大規模圖數據分析問題。騰訊在2018年成爲LF AI基金會的創始白金會員之一,並於同年向基金會貢獻了開源項目Angel。
騰訊雲副總裁、騰訊數據平臺部總經理蔣傑表示:「騰訊致力於經過開源代碼,與開發者共建開源生態、實現成果共享,已成爲大數據領域開源最爲全面的公司。咱們很高興看到Angel從LF AI基金會成功畢業,在基金會的指導和開發者的共建下,完成從單一的模型訓練平臺到全棧機器學習平臺的技術跨越,這也與騰訊大數據批流融合、ABC融合的將來發展方向緊密契合。畢業是Angel新的開始,將來咱們將進一步開放Angel在圖計算和聯邦學習領域的核心能力。」
據LF AI 基金會董事、騰訊AI專家肖涵介紹,LF AI基金會對開源項目的畢業流程有很是嚴格的規定,基於項目的技術含量、開源生態、社區互動等維度,嚴格評估項目的成熟度,最終由董事會投票決定可否准予畢業。可以從LF AI畢業,意味着項目已經獲得全球技術專家的承認,成爲最頂級的AI開源項目。
Angel在基金會的孵化過程當中得到了快速發展,並完成了從2.0版本到3.0版本的跨越,從一個單純的模型訓練系統進化成包含從自動特徵工程到模型服務的全棧機器學習平臺。算法
LFAI & Angel
Angel的特徵工程模塊基於Spark開發,加強了Spark的特徵選擇功能,同時使用特徵交叉和重索引實現了自動特徵生成。這些組件能夠無縫地整合進Spark的流水線。爲了讓整個系統更加的智能,Angel 3.0新增了超參數調節的功能。
在模型服務方面,Angel 3.0提供了一個跨平臺的組件Angel Serving,不只能夠知足Angel自身的需求,還能夠爲其餘平臺提供模型服務。在生態方面,Angel也嘗試將參數服務器(PS)能力共享給其餘的計算平臺,目前已經完成了Spark On Angel和PyTorch On Angel兩個平臺的建設。數據庫
圖計算體系架構服務器
在3.0版本中,Angel重點研發了圖機器學習功能,包括圖表示和圖神經網絡學習模型,同時提供預處理、圖挖掘等端到端數據處理能力,具備豐富的算法庫,提供了同構圖、異構圖多種圖計算範式和不一樣種類的圖算法。通過騰訊內部業務的大規模實踐,Angel在圖算法性能上一樣表現出衆,例如十億節點、千億邊規模的圖結構,運行算法時能以Spark GraphX三分之一的計算資源,達到十倍處理性能。
圖計算性能對比
除了技術功能上的完善,Angel在社區生態上也日趨成熟。據瞭解,在全行業Angel擁有超過 100家公司和機構用戶,其中包括微博、華爲、微衆銀行、小米、滴滴等大型互聯網企業。基於Angel構建的一站式機器學習應用平臺智能鈦TI,支持了包括微信支付、騰訊廣告、微視等在內的諸多騰訊內部產品,同時也經過騰訊雲對外開放爲更多行業企業提供服務。
截止目前,Angel在GitHub上已經得到了5500 Star,1400 Fork,在技術、應用、生態等方面的優秀表現均獲得了開源社區的承認。此前在騰訊2019 Techo開發者大會上,蔣傑還宣佈了資源管理平臺核心TKE和分佈式數據庫TBase的正式開源。騰訊正在成爲大數據領域開源最全面的公司。
開源協同是當前騰訊最重要的技術戰略之一。在今年的重慶智博會上,騰訊公司董事會主席兼首席執行官馬化騰專門說起了對開源的重視,他表示,騰訊但願在科研領域投入更多力量,將經過內外部開源等方式,積極參與「全球科技共同體」的共建。
截止2019年11月,僅在Github上,騰訊就開源了91個項目,有超過1000個貢獻者參與,得到超過26萬個Star數,在Github全球公司貢獻榜上居於前列。騰訊還加入了Linux、Apache等9大開源基金會,併成爲最高級別會員。其中LF AI基金會是由Linux基金會發起的人工智能領域的專項開源基金會,旨在倡導和組織AI開源平臺和工具共同參與建設,共同享有IP知識產權,建立可持續發展的開源AI生態系統。
2018年,騰訊因在AI開源領域的卓越技術影響力,受邀做爲LF AI基金會的初始白金會員加入,擁有董事會和技術諮詢委員會席位,並於同年向基金會捐贈高性能分佈式機器學習平臺Angel。微信